2025 PolarDB DevCon 归来...

原创 精选
人工智能
在媒体见面环节,阿里云官方也谈到了对开源想法。其开源策略,是作为公司战略方向来投入的。开源产品力的构建,都是在大规模云上验证过后开源开放,都是企业级能力,可见公司对开源的支持力度。

近日受邀参加了由阿里云主办的2025 PolarDB 开发者大会。会上重点发布了PolarDB的近期的一些成果,很令人期待。此外,还特参加了针对媒体的专访活动,听到阿里云官方的一些信息。整个一天会议下来,收获满满,下面就谈谈我对大会的一些感受。

1. 大会观感:理念篇

1).DATA + AI:双轮驱动引擎

在大会初试环节,阿里云PolarDB定位为“数据与智能双驱动的数据平台”,这首次将AI放入如此高的位置。随着近些年来大模型的大热,包括近期焦点的DeepSeek,无疑都将人工智能的使用门槛大大降低,企业对于AI的需求正变得更加热切。从下图的人工智能大模型生命周期可见,人工智能通俗来讲其实是一种“数据应用”,一方面是需要依赖数据,需要数据存储能力相配合;一方面是一种新型的数据计算方式,需要有对应的算力。从这个角度来看,当前数据的主要载体“数据库”就变得非常合适,如果能在一个平台中涵盖从数据存储、数据计算、人工智能等多种能力,那无疑对客户是非常有意义。这也是PolarDB在此次大会上传达的一种思想。

1.PNG1.PNG

2).“一体化”的全新解读

从上面双轮驱动的引擎引申过来,就是希望打造一款“一体化”的数据处理平台。从数据库/仓库的发展来看,其实一直在沿袭这样的道路。在数据库诞生之初,其定位主要是完成在线交易(OLTP)的能力,随着数据规模的增加、数据计算复杂度的增大,出现了在线分析的诉求,于是有了OLAP。但这种情况,就不得不面临数据来回搬迁的问题(ETL),随着对数据处理的时效性、经济性等多方面的考虑,后期又出现了HTAP,正是在OLTP与OLAP的能力结合,提出的一种一体化的技术方案。与此类似的,还包括结合数据仓库与数据湖能力的湖仓一体等等。那么如今,在人工智能方兴未艾之时,是否会出现一种新的数据处理能力“OLIP”呢?显然,我们不想重蹈覆辙,而是在早期就考虑一体化的方式。这就是PolarDB希望打造的一体化数据库产品,即用一款产品满足用户多元化的需求,让技术决策变的简单。那么从下图可见,其一体化的能力包括的多层的解读。从内到外,在一个核心的基础上,包括生态一体化(MySQL、PG、Oracle)、架构一体化(集中式、分布式)、场景一体化(OLTP、OLAP、OLIP)及若干通用性能力(高可用、高弹性、智能化等等)。

2.png2.png

我们从另外一张简图了可见,PolarDB 通过一站式的统一入口接入,下面针对不同对数据计算需求,可灵活配置多种计算负载节点,包括有面向交易的RW节点、面向查询的RO节点、面向在线分析的HTAP节点、面向人工智能的AI节点、面向向量的Vector节点等。并且上述节点横向可实现1~63个节点的扩展,纵向可实现从0.5~32CPU的资源扩展。真正实现一体化,满足用户需求。

3.PNG3.PNG

其实,这也是一种趋势,从下图来自Gartner魔力象限分析来看,已经不再按场景区分数据库产品及厂商进行对比,而是将多种场景全部纳入统一考察范畴。下图中的云数据库管理系统,就是覆盖有多种场景来看待。

4.png4.png

3).新一代云数据库“3.0版本”

回顾数据库的发展,数据库从之前的传统数据库、到后期的云托管数据库、再到云原生数据库。伴随着云这种新的资源供给方式的出现,数据库也在不断演进变化。其核心点正如下图所示的,将数据库服务供给能力与数据库需求之间平衡,希望打造一种能完全贴合需求的一种资源供给方式。云原生数据库,这种按照云单独设计的数据库产品更有利于使用好云资源,提供更为便捷、经济的数据库服务。

5.png5.png

展开来看,现代的计算机并没有脱离传统的冯诺依曼体系,与之不同的是计算机内部资源的排布。从传统的简单划分为计算与存储,到云所提供的可拓展的计算机资源。理论来说,我们可以将整个数据库中心视为一台计算机,其内部CPU、MEM、STORAGE、NETWORK等都是可以灵活分配来使用。PolarDB正是基于此构建自己依托云的架构,包含了两种架构(Share-Storage、Share-Nothing)。

6.png6.png

其一直致力于将各层次云资源解耦,充分利用云所提供的弹性能力。如果我们将之前的托管时代的数据库,称为云数据库1.0版本,以存算分离为代表的云原生数据库称之为2.0版本,那么现在以计算/内存/存储三层解耦为代表的新一代云原生数据库,就可以成为云数据库的3.0版本。

7.png7.png

那么未来,包括如GPU等为代表的新兴硬件也可以实现资源解耦,真的就可以将整个数据中心当做一台拥有海量资源的计算机了。会上PolarDB也阐述了对云原生数据库发展方向的一些思考,就包括了多层解耦、Serverless、架构一体化、多种工作负载(HTAP、Data+MLOps等)、写扩展(多主多写)、数据存储优化(压缩、分层)等等。

8.png8.png

2. 大会观感:产品篇

1).软硬结合新突破-CXL

此次大会最为重磅的产品发布,就是基于CXL技术发布的PolarDB的新版本。所谓CXL,是一种将CPU与MEM解耦的连接技术,通过两者解耦,可实现内存池化、做到内存里的数据共享,有助于大幅降低TCO。

9.png9.png

CXL的出现,突破原有架构在扩展性方面的不足,在极低的延迟下提供近似本机的资源访问能力,真正在CPU、MEM、STORAGE全部独立可扩展,并且有了内存共享能力后,也有助于实现更轻量化计算节点的扩展、更快速的可用性切换、更简洁高效的数据库内核,实现了性能与扩展性的双重提升。

10.png10.png

此外,在会议上也提到,针对此次CXL技术,也同步推出了数据库专属机型(会场内就摆了一台,不少人参观),未来将在公有云规模化使用。但官方也表示,目前尚无推出一体机的计划。

11.png11.png

除此之外,PolarDB 还谈到对新一代持续化内存AliSCM,配合SSD可实现更为快速的持久化等等。

12.png12.png

2).模型算子化

另外一个发布的产品的重要能力,就是模型算子化(即 PolarDB-Model as an Operator)

13.png13.png

所谓模型算子化,就是将对数据模型处理能力内置在数据库中,通过SQL或API的方式来使用。这点是基于对人工智能未来发展的一些判断,因而内置这一能力。一方面,模型训练仍然面临高昂的成本问题,会逐步寡头化,只有上游少数几个玩家,更多用户会基于此做微调,AI应用后期会大规模爆发,需要在底层支持能力上做好准备;另一方面,数据被人工智能使用,不得不面对安全问题,如何能做到数据不出域、不搬迁就能实现计算,这也对底层基础平台提供了更高的要求。此次发布中,PolarDB通过模型内置,支持通义千问和DeepSeek,并通过优化实现更高效率计算,进而支持更多在线用户。

3).其他产品亮点

14.png14.png

15.png15.png

16.png16.png

17.png17.png

18.png18.png

3. 大会观感:趋势篇

1).云是未来,也是现实

会上来自Gartner分析师也谈到对云的一些判断,其观点是“云数据库是未来趋势,也是现在的现实”。通过Gartner收集的全球数据库市场数据来看,一方面云厂商逐步占据主导,另一方面增量也多来自云市场。此外根据Gartner的预测,2027年,云数据库会占据整个数据库市场份额的70%。可以说,云不是一种未来趋势,已经是实际正在发展的一种变革。

19.png19.png

2).现有平台会成长为AI底座

Gartner预测,未来企业级AI应用的核心是数据,而不是模型。企业独有的高价值密度数据才是AI的杀手锏。技术革命的高速变化对底层平台可组装性提出更好要求。到2028年,80%的生成式AI业务应用将会在企业现有的数据管理平台上开发,从而将实施复杂性和交付时间减少50%。这也对现有厂商及产品提出了更好的要求,这也可以理解诸如向量数据的存储与计算都开始成为数据库的标配功能了。

3).关系型吞噬非关系型

Gartner预测,未来只会有一个数据库市场。之前出现的关系型与非关系型并立的情况会改变,关系型产品虽然不能完全替代非关系型数据库产品,但会大幅度替换。预计到2027年,全球非关系型数据库(NoSQL)的功能中的80%会被整合到关系型数据库中,这一比例高于2022年的60%。这也是我们看到关系型数据库中开始越来越多内置对多模数据的处理能力。

4).云厂商不会通吃数据库市场

因为云中立等问题,云厂商不会通吃掉独立数据库厂商,后者仍然会有较大的生存空间。从海外的诸如Snowflake、MongoDB等发展,可见一斑。

5).数据库技术变革是马拉松

数据库技术变革不是短跑,而是一场马拉松。现在的一项独特功能,可能在几个月后就变得司空见惯。用户不会为个别功能买单,而是会考虑选择一个全能战士。通过时间的积累,数据库功能会趋同,只有跑的长远的选手才能最后脱颖而出。

4. 大会观感:其他篇

1).TPC-C 打榜发布

虽然在春节期间,已经披露了这一消息,但本次大会是正式将这一打榜情况做一发布。这里还是要恭喜下阿里云PolarDB产品,取得这一佳绩。这一打榜除了博取大家眼球之外,更多意义是来自PolarDB追求极致性价比,更高效利用资源的一个缩影。这是对广大用户具有现实意义的。此外,会上也谈到小的一点遗憾,此次打榜的性能受限于存储容量,尚未发挥到最佳水平,据测算理论上最终可达到28亿tpmC的成绩。

20.png20.png

2).阿里云是“最云原生”厂商

来自 Gartner 的分析指出,阿里云是中国数据库厂商中“最云原生”的一家,这无疑是对阿里云的一种褒奖。那么阿里云做了什么,才使其成为最云原生的呢?在会后交流中,阿里云谈到其产品设计构建中,坚持了三化原则,即标准化、产品化、规模化的原则。甚至不惜丢掉一些单子,也坚持了这一原则,产品完全基于公有云来构建。

21.png21.png

3).开源策略是战略方向

在媒体见面环节,阿里云官方也谈到了对开源想法。其开源策略,是作为公司战略方向来投入的。开源产品力的构建,都是在大规模云上验证过后开源开放,都是企业级能力,可见公司对开源的支持力度。在开源生态构建上面,始终秉持着开放态度,目前也正在适配开源大模型。在社会活跃上,将进一步放大群体,激发包括但不限于传统DBA、开发者参与进来,未来也将向企业业务去拓展。

4).拥抱信创,拥抱云化

作为强监管驱动的信创市场,阿里云也是非常关注。作为国内为数不多的集中式、分布式都通过国测的国产数据库厂商,阿里云正全面拥抱这一市场,从产品力打造、服务支持等多角度加大投入。与会上也谈到一个不可回避的话题,云数据库是否在信创也有市场?云作为大势所趋,信创也在拥抱云,但又与公有云有所不同。针对这一问题,阿里云领导也给出一个形象的比喻,公有云与专有云(私有化部署)就如同大海与湖泊,体量有所差异,但底层是相通的。

22.png22.png

责任编辑:武晓燕 来源: 韩锋频道
相关推荐

2024-01-23 07:33:12

PolarDB开源数据库云原生

2025-02-26 13:44:55

2018-09-15 15:07:50

AppleiPhone手机

2013-10-23 10:30:21

搜狗

2024-04-15 07:42:40

数据库关系型数据库数据多模

2011-01-24 15:52:07

2010-01-18 16:26:15

2011-04-14 17:36:15

Android 3.0iPad佩奇

2020-10-10 12:53:57

逻辑回归机器学习分析

2011-04-02 11:41:40

Windows Emb嵌入式开发

2012-05-15 11:31:51

Ubuntu操作系统

2017-05-23 12:03:07

诺基亚5G上海贝尔

2024-05-15 09:53:22

2014-09-11 15:18:09

2012-02-02 10:35:12

C++

2011-09-06 14:26:26

2009-11-04 09:08:20

Windows 7系统特性

2012-06-12 10:06:57

云存储

2020-12-28 10:55:23

Emotet僵尸网络攻击

2014-07-08 10:30:24

点赞
收藏

51CTO技术栈公众号