随着信创改造的深化及国产软件兴起,越来越多的国产数据库受到大家的关注。近期看到网上几篇关于国产数据库代码起源、开源情况的文章很火,想必广大企业用户也很关注这些问题。下文从墨天轮社区及各数据库厂商官网收集信息,共收录国产关系型数据库165家;对信息分析供参考。
❖ 部分厂家产品采用单一品牌多款产品形式,统计时会拆分处理。
1. 大调查:总览篇
1).流行度
墨天轮社区提供了流行度评分,其计算方式是参考搜索引擎、趋势指数、三方评测、生态(社区、高校合作、培训认证等)情况、专利数、论文数、招聘岗位数、书籍搜索量、海外机构排名(Gartner、IDC)综合得到的分数。从上述评分可以反映产品流行程度。从下图反映的情况来看,头部聚集效应凸显,前十名的产品流行度总体占比超72%,前二十名产品的流行度总体占比超82%。
2).地域分布
从地区分布来看,头部效应更加明显。北京占比最高,在收集的165家企业中,超半数坐落于北京;深圳、上海、杭州也聚集部分厂商。企业地域聚集现象,一方面与人才市场因素有关,一方面也是很多数据库企业来自于互联网或传统行业大厂,与这些大厂分布也有关。
如果加上数据库流行度评分,各地域的差异就没那么明显,深圳、杭州表现突出,武汉和天津则有几个排名靠前的数据库头部厂商。
3).使用场景
传统数据库的使用场景,主要分为OLTP和OLAP。如今,更多细化的场景没提出,如近年比较火的HTAP。很多数据库产品是可以满足多种场景,统计中按照支持场景进行分类。如单产品支持多场景或有细分产品满足此场景,会单独统计。从下左图可见,OLTP仍然是主流场景,OLAP次之,HTAP也作为很多新产品主打的理念。如果在叠加上流行度因素,如下右图可见,支持HTAP产品的流行度明显较高。也就是说越来越多的头部厂商也将支持HTAP场景作为其主流使用场景之一。
4).开发模式
随着开源理念逐步被广泛接受,正有越来越多的产品选择开源模式运作。从左图可见,大部分厂商采用商业开发模式,开源模式还仅占少数。但如果考虑到流行度的问题,情况则大不同。参考右图,叠加上流行度因素可见,开源占比已接近商业,也就是说头部的厂商更多采用开源策略。这也与其流行度较高有着密不可分的关系。
2. 大调查:技术篇
1).技术架构
从技术架构演进来看,数据库走过了单机式、集中式到分布式的发展,目前是多种架构并存的阶段。分布式架构以其更好的扩展能力,受到更多的关注。当然我们也需要意识到,分布式因其架构特点决定,会失去一些传统架构的优点。而对于大部分场景来说,集中式甚至单机架构就可以满足。从下图可见,两种架构产品处于均分的状态,甚至分布式稍占优。
从场景上来看,不同场景的架构占比还有所不同。对于OLAP、HTAP等领域,因其承载数据规模及算力更大,分布式产品更有优势,因而分布式也会占比更高。
2).部署环境
从部署环境来看,本地部署与云原生环境并存。多款产品支持在两种环境中部署。但从整体来看,仍然是以本地部署方式为主,云原生的部署方式占少数,如左图。从技术架构来看,分布式更容易利用云原生提供的计算与存储能力,因此更多地支持云原生部署,如右图。
3).代码来源
作为基础软件之一,数据库需要较大的代码工程量。在这其中,完全自研还是利用开源产品快速构建是两类思路。如下图来看,从数量来说,独立自研产品仍然占多数(其中有些产品未明确声明基于开源构建,因而算为自研)。基于开源构建来说,MySQL和PG是作为流行的两款开源数据库产品,大量的商业产品基于其开发。值得关注的是排名第三的openGauss,作为一款国人开源的数据库产品,众多商业产品基于其构建值得祝贺。
如果从另一个角度流行度来看,基于PG构建产品的总流行度要超过基于MySQL构建的产品。但这里有个特殊情况,有些登记的产品是单一品牌多款数据库,但流行度评分是一个,存在一定的偏差。
4).兼容性
数据库兼容能力,是快速获得用户的关键,特别是一款新产品。之前国内数据库市场以海外大型商用数据库为主,其占据了很大的份额,构建了完整生态。作为国内产品如果想快速被用户接受,兼容其他拥有较好生态产品是个不错的做法。从下图可见,MySQL作为最为流行的开源数据库,也成为众多厂商首选的兼容对象,其次是PG和Oracle。
如果我们考虑流行度因素来看兼容性占比,则MySQL仍然为第一,但Oracle、PG整体也占比很高,特别是Oracle成为接近MySQL的第二兼容选择。