随着互联网、云计算等技术的快速发展,数据量呈爆炸式增长,数据环境千变万化,数据类型越来越多,再加上用户需求的个性化,交互行为的实时性,导致传统数据库和传统的数据处理方式已经很难满足对数据的处理要求。
HTAP(Hybrid Transactional/Analytical Processing)的概念由Gartner在2014年首次提出,这种框架能够“通吃”事务型及分析型两大数据库场景,避免了繁琐且昂贵的对数据再加工的操作,可以更快地对最新数据进行分析。Gartner在多次报告中强调,HTAP是数据库领域最重要的发展趋势之一,也是用户数字化转型中重要的数据平台。
如今,几乎所有数据库大厂和云巨头都在布局HTAP,其中,始创于2010年的OceanBase,是我国完全自主研发的企业级原生分布式数据库,其创新推出的 “三地五中心”城市级容灾新标准,在被誉为“数据库世界杯”的TPC-C和TPC-H测试上都刷新了世界纪录。OceanBase自研一体化架构,兼顾了分布式架构的扩展性与集中式架构的性能优势,用一套引擎同时支持OLTP和OLAP的混合负载,具备数据强一致、高扩展、高可用、高性价比、高度兼容 Oracle/MySQL、稳定可靠等特征,不断用技术降低企业使用数据库的门槛。
4.0版本:让分布式数据库走向通用
今年8月10日,国产自研分布式数据库OceanBase举办2022年度发布会,面向全球用户发布全新4.0产品。如果说OceanBase的第一次大改造是在0.5版本到1.0版本,让其真正成为金融级分布式数据库。那么,从3.0到4.0的升级可谓是OceanBase的第二次大改造,这让OceanBase真正成为了面向云时代的通用数据库。
具体来说,OceanBase 4.0有效兼顾了分布式架构的扩展性与集中式架构的性能优势,既可以实现单机部署,又可以在单机部署下实现分布式部署的完整功能,从技术上首次突破了分布式数据库的单机性能瓶颈。在测试中,同等硬件条件下,OceanBase 4.0单机能力性能超越MySQL。在交易处理场景下,全新设计的融合日志缓冲区将同时支持聚合提交和分布式共识协议,显著减少内存拷贝和CPU指令开销,大幅度提升交易处理能力。
相较于OceanBase社区版3.1,4.0版本在OLTP读写混合测试场景(read&write)性能提升100%,OLTP只写场景(write only)性能提升130%。每个10%的性能提升,对于OLTP都是非常艰难极具挑战的事情,而OceanBase 4.0通过事务引擎的重构,大幅优化存储和SQL引擎,让OLTP性能有1倍以上的提升。
来自客户的需求:进一步降低OceanBase的使用门槛
自2020年正式商用以来,OceanBase已经服务了超过400家金融、政府、运营商、零售、互联网等行业的客户。在服务客户的过程中,OceanBase团队遇到到了一些挑战。比如如何帮助客户屏蔽基础设施软件的复杂性,如何帮助客户支持系统良好运行,如何帮助客户降低使用和运营不同产品和系统的成本。为了应对这些挑战,需要进一步降低OceanBase的使用门槛,打破分布式数据库的边界,让分布式数据库进一步走向通用。
基于此,OceanBase社区版4.0 “小鱼Paetica”首个beta版本正式亮相。
更低要求的部署环境
分布式数据库对设备配置要求普遍较高,所以一些用户经常会遇到因为资源不够而部署失败的情况。OceanBase从3.x 版本生产环境最低要求8C64G, 到4.0 的4C16G, 意味着更多的用户场景可以使用OceanBase,在一些单机MySQL场景也可以使用OceanBase的单机部署形态获得更强的能力。OceanBase社区版 4.0在此基础上更进一步,业务支持的初始阶段可以仅使用单机部署,随着业务压力的变化将数据库集群平滑地从单机扩容到多机,同时具备多机平滑缩容到单机的能力。
更高的性能
数据库的高性能、高可用性、可扩展性是支撑用户业务平稳运行的必要条件。对于分布式数据库来说,把OLAP交易和 OLTP分析都做好,才能赢得客户的信任。在前不久召开的云栖大会上,OceanBase CTO杨传辉现场演示了社区版4.0的TPC-H性能:同等硬件环境下(3台32C、128G),测试OceanBase社区版4.0 Beta与Greenplum 6.22.1在22项复杂查询及并行数据修改任务中的压测时长。测试结果显示:OceanBase社区版4.0的性能是Greenplum6.22的5~6倍,部分场景达20~60倍。
而在今年8月举办的年度产品发布会上, OceanBase 4.0与MySQL企业版8.0进行了现场性能对比测试,结果显示:在同等硬件条件下,OceanBase 企业版4.0的性能是MySQL企业版8.0的1.9倍。
更快的部署
国产分布式数据库普遍难部署,让初学者望而却步。在全新的OceanBase社区版4.0中,可以通过一体化极简安装包,将所有组件提前做好适配测试,并给出推荐组合版本,让组件之间的依赖变得简单。此外,面向刚接触分布式数据库的用户,OceanBase社区版4.0提供一键安装命令“obd demo”, 快速安装OceanBase集群demo环境,帮助用户跳过集群的复杂配置步骤,大幅避免用户因为不熟悉配置参数导致集群配置错误以及最终安装失败的问题,提升易用性,帮助用户以更快的速度、更便捷的方式体验上手OceanBase。
结语
基于一个系统、一份数据,OceanBase社区版可以在高性能OLTP基础上帮助用户构建实时分析能力。OceanBase通过原生分布式技术提供高性能的OLTP能力,真正通过“一个系统”同时提供事务处理和数据实时分析能力,“一份数据”用于不同的工作负载,从根本上保持数据的一致性并最大程度降低数据冗余,帮助企业大幅降低总成本。
正如OceanBase CTO杨传辉所说,“降本解决生存问题,增效解决发展问题。 OceanBase的单机分布式一体化数据库,不仅仅是降成本,更是空中换发动机,能帮助客户更好地实现降本增效。”