“什么是一个好的数据库?一款好的数据库,必须具备国际化数据库所拥有的过硬的技术能力,同时要有非常远大的目标,能够真正帮助用户实现业务增长。同时,针对不同的地区和市场,它还需要具备本地化特色,从而更好地助力本地市场的成功。满足这些条件的数据库才能称得上是一款真正优秀的数据库。”
近日,PingCAP 举办了TiDB 媒体分析师沟通会。会上,平凯星辰联合创始人兼 CTO黄东旭、平凯星辰研发副总裁唐刘以及平凯星辰总经理余梦杰,围绕DATA+AI、TiDB更新以及未来规划,并分享了多个行业领先企业的成功案例。
技术过硬、快速响应,TiDB获得来自国内外市场的认可
在全球化的浪潮中,PingCAP正以独特的优势在国内外的舞台上崭露头角。在这背后,是PingCAP的不懈努力与辛勤耕耘。
2023年9月,平凯数据库的发布标志着PingCAP对中国客户提供业务增长的支持。平凯数据库基于TiDB开源内核构建,并针对中国企业的独特需求及市场特点,开发了一系列企业级组件,形成了一款专为企业级市场设计的分布式数据库产品。
在中国市场,TiDB 深入金融行业核心系统,在国有大行、股份制银行、城市商业银行、保险、证券等领域的应用规模和成效都实现了跨越式的发展,成功实现了对经典数据库(Oracle、MySQL)等基础环境的升级与替换。于此同时,有越来越多的制造、零售、物流、能源、餐饮、医疗、政企和互联网客户将 TiDB 部署在多种业务场景。
在这些成绩的背后,主要得益于几个关键因素。首先,PingCAP始终高度关注中国市场,并针对中国客户的特定需求进行了大量开发和优化,这为获得认可奠定了坚实基础。其次,TiDB的开源理念在中国数据库领域中占据领先地位。在开源数据库名单中,TiDB是极少数100%真正开源的项目,这种坚持赢得了业界的广泛认可和支持。最后,国家对科技创新的大力倡导以及对企业国际化的支持,为中国数据库的发展提供了良好的外部环境。
而在海外,PingCAP与多个国际客户建立了合作关系,例如全球领先的图片分享社交平台 Pinterest、美国大数据 AI 头部企业 Databricks、日本头部电商 DMM.com、欧洲头部出行服务平台 Bolt、东南亚物流企业 ninjavan 等。
这些合作案例不仅证明了TiDB的技术实力,也展示了在全球不同地区和行业的广泛应用。因此,TiDB凭借广泛的全球用户基础,获得了多家权威分析机构的全球认可。
2024年6月,Gartner®发布的《Market Share Analysis: Database Management Systems, Worldwide, 2023》报告,PingCAP以97.9%的增长率,在全球数据库管理系统市场中增速领先。此外,PingCAP还荣登《Forrester Wave™: Translytical Data Platforms, Q4 2024》报告,成为中国数据库厂商中唯一连续两次上榜的企业。更值得一提的是,在DB-Engines的关系型数据库排名中,TiDB作为中国数据库产品首次跻身Top 50。
反映出全球客户对TiDB的信任,也是全球开发者对TiDB的高度认可。
不过,PingCAP作为一家中国企业,为何能在海外市场占据如此之大的优势?黄旭东介绍,首先是中国伙伴在技术领域展现出的自信,特别是在硬核技术方面,中国企业及其工程师的经验和实力都是在海外的竞争优势。
其次,另一个核心竞争优势就是能够快速响应客户需求。客户对于“能够7x24小时随时联系到TiDB团队,并在15分钟内得到响应”给予了高度认可。作为一家全球化公司,TiDB在全球各地,包括美国、东南亚、日本和中国都有工程师团队为客户提供的云服务,克服了时区和地域的限制。这种全球服务能力是TiDB的重要价值之一,确保了海外业务的顺利进行。
平凯星辰联合创始人兼CTO 黄东旭
Data与AI的共生未来
随着AI技术的应用,检索增强生成(RAG)模型成为一种重要的商业模式。无论选择何种大型语言模型,关键是背后的数据。黄旭东认为AI的核心价值在于能够有效地利用数据,特别是如何存储、访问和运用数据,这将决定AI应用的真正潜力。
所以面对AI应用日益复杂的数据处理要求,如何存储并高效利用数据成为当前技术的核心问题。在这样的背景下,数据库的可扩展性、灵活性、成本效益和简洁性成为了新的关注重点。
首先是可扩展性。在当今的数字化世界中,几乎每一次用户与数字平台的互动都会生成数据,而这些数据具有非常大的商业价值。通过对这些数据的存储与分析,企业能够更好地理解用户行为,进而优化产品推荐与商业决策。不过一个用户产生的数据量不大,但是成千上万的用户就会产生巨大的数据量,因此企业对数据存储容量的需求急剧增加。
不仅如此,数据库可扩展性的衡量标准已经不再仅仅依赖于数据量的大小。在传统的数据库架构中,单纯的容量扩展只是浮于表面的问题,真正的难题在于如何处理更复杂的查询和更高频的操作。当每个人都拥有自己的数据集时,数据表的数量也会呈指数级增长。这就要求数据库不仅要支持大规模的数据存储,还要在查询效率、负载均衡等方面具备更强的能力。
其次,灵活性也是一个不可忽视的关键要素。在满足个性化服务需求的同时,数据库必须具备更高的灵活性。传统的数据库架构往往无法满足千人千面的需求,尤其是在大规模应用场景中,所以数据库的灵活性与可扩展性之间的平衡尤为重要。
面对这些需求,云服务厂商已经在这方面取得了显著的进展,但数据库厂商却不知如何应对。不过,TiDB早在2019年就开始将内部的数据库资源转向云服务,但这一路走来并不容易。
自2019年TiDB Cloud上线以来,TiDB面临技术重写、团队调整等一系列困难,但最终逐步实现了跨越式的成长。从2023年开始,TiDB Cloud的客户数量增长了10倍,数据量则增长了40倍;而TiDB Cloud托管的集群数量已超过5万个,单个客户的集群规模已达到1.2PB,单个集群的表数量超过70万张,且峰值QPS超过260万。这些都标志着TiDB Cloud取得了巨大的成长和突破。
平凯星辰研发副总裁 唐刘
致力于打磨一款好的数据库,向All-in-one Database前进
在2025年来临之际,PingCAP也展望了TiDB未来的发展趋势。
TiDB的发展一直具有前瞻性,所以为了应对未来十年的需求,TiDB启动了新一代引擎开发。这款新引擎的核心理念是采用对象存储,并基于此构建OLTP(联机事务处理)引擎。
采用对象存储的好处显而易见,首先它可以大幅降低分布式存储系统的复杂性。由于对象存储本身已经具备了高可用性和强大的分布式能力,TiDB不再需要重新开发这些基础功能,而是可以将精力集中在应用层面的创新上。
其次,基于对象存储可以大幅降低成本。在传统的数据库架构中,数据库是独立的存在;而在云原生环境下,数据库重新被设计为一组微服务的组合,每个模块都在实现自我迭代。因此,TiDB的新架构不再依赖“升级”这一概念,只需要保持Serverless接口的稳定,便能够实现动态扩展和更新。
最后,TiDB的另一个挑战是应对多租户场景。过去,TiDB的设计主要面向在单一业务的大数据量场景,而未来的TiDB需要支持真正的大型多租户场景,所以如何在多租户基础上实现资源共享成为了一个巨大的挑战。不仅如此,TiDB最终想要实现的是,在保证重要业务100%隔离、可靠和安全的基础上,还能有条理、有逻辑地将空闲资源分配给不太重要的业务,从而实现资源的高效利用和共享,这也是TiDB未来技术架构的一项独创性优势。
所以对于TiDB来说,Serverless不仅仅是一个新的产品线或面向小用户的解决方案,更是下一代TiDB引擎的核心技术之一。但是,对于新一代的引擎,其重点可能在于未来三年的迭代、创新和验证,最终会逐步演进到“TiDB one”。
TiDB的未来不仅仅聚焦于传统的数据库技术,还会顺应AI浪潮的发展。目前,TiDB正在积极为AI场景进行布局,推出了相关的Vector Search(向量搜索)功能,进一步拓展TiDB在智能化时代的应用能力。
此外,TiDB也在推进面向客户服务的RAG(检索增强生成)模式。黄旭东介绍,如果想打造一个优秀的RAG应用,不仅需要强大的向量引擎,还需要集成向量搜索、检索技术、知识图谱等多种技术,还需要记录与系统的交互记录,从而共同构成 RAG 应用的核心,有效地理解和响应用户的查询。更重要的是,所有这些功能必须能够在单一数据库平台上高效协同,这样才能简化开发者的工作负担。所以,TiDB在正在向All-in-one Database的方向发展,使开发者能够在一个平台实现多种技术的集成,降低系统复杂性和开发成本。
平凯星辰总经理 余梦杰
TiDB 致力于成为引领 AI 时代创新的首选分布式(云原生)数据库。这条道路虽然充满荆棘,但也是独一无二、蕴含着无限机遇的道路。凭借PingCAP对创新的持续追求和对市场需求的敏锐洞察,TiDB必将突破瓶颈,成为更加智能、高效、灵活的数据库平台,最终为全球客户提供更加深度和全面的服务。