几款优秀的分布式关系数据库

译文
数据库 其他数据库 分布式
这些横向扩展的SQL数据库提供了横向扩展性和支持ACID事务的功能——一些支持全局规模。

[[270121]]

【51CTO.com快译】关系SQL数据库自上世纪80年代以来就有了,以前运行在大型机或单一服务器上。如果想让数据库处理更多数据、运行得更快,只好将数据库放在配备更多更快的CPU、内存和磁盘的更庞大服务器上。换句话说,你求助于纵向扩展性即“向上扩展”。以后,如果你需要能够故障切换以改善可用性,可以将热备用服务器与活动服务器放在同一个“主动-被动”集群中,通常采用共享存储。

需要ACID的四个属性:原子性、一致性、隔离性和持久性,才能确保数据库事务始终有效,即使出现网络分区、电源故障及其他错误。单一服务器上的数据库遵循ACID的全部四个属性比较容易,但针对分布式数据库实施这些属性要难一点。

最近市面上出现了几种“横向扩展”的SQL数据库。更棒的是,其中一些数据库可以处理地理位置分散的服务器,而不牺牲一致性。由于光速带来的限制,边远的服务器节点比本地节点需要更长的时间来更新,但几种技术可以缓解这个问题,包括使用共识组quora和超高速网络及存储。

通常,你一直使用的数据库和想要使用的新分布式数据库应尽可能兼容,尽量降低模式和应用程序转换成本。简单的情况是,你可以迁移模式和数据,然后只需更改应用程序中的连接字符串。复杂的情​​况是,你需要完成数据转换过程,全面重写存储过程和触发器,大范围重写应用程序的数据层,包括SQL查询。

Amazon RDS和Amazon Aurora

Amazon RDS(关系数据库服务)这种Web服务让用户更容易在云端安装、操作和扩展关系数据库。Amazon RDS支持MySQL、MariaDB、PostgreSQL、Oracle Database和微软SQL Server。

可以使用面向故障切换的同步辅助实例来配置Amazon RDS数据库,以实现高可用性。遗憾的是,你无法从备用辅助实例中读取。可以使用MySQL、MariaDB或PostgreSQL Read Replicas来加强读取扩展,但复制是异步的,因此副本的状态可能落后于主实例的状态。

Amazon Aurora是Amazon RDS中的一项服务,可在快速分布式存储上提供高性能的MySQL和PostgreSQL数据库集群。你可以在数据库集群中最多创建15个Aurora Replicas以支持只读查询,可以在多个可用区(AZ)中创建副本,以实现全局分布。

据亚马逊声称,Aurora可以提供最多五倍于MySQL的吞吐量,最多三倍于PostgreSQL的吞吐量,无需更改大多数现有应用程序。亚马逊还声称更新Aurora读取副本的延迟时间约20毫秒,这比MySQL读取副本快得多。

Azure SQL Database

Azure SQL Database是一种全面托管的关系云数据库服务,提供广泛的SQL Server引擎兼容性,让你可以动态增减数据库资源。Azure SQL Database包括创建活动地理副本的选项,这些地理副本是地理位置分散的辅助数据库。

在相同或不同的区域支持最多四个辅助数据库,辅助数据库还可用于只读查询。如果你需要将主数据库故障切换到其中一个辅助数据库,可以手动或通过API执行此操作。

ClustrixDB

ClustrixDB现归MariaDB所有,这个横向扩展的集群关系HTAP(混合事务/分析处理)数据库采用无共享架构设计。ClustrixDB主要与MySQL和MariaDB兼容。我测评ClustrixDB时,该产品不支持空间扩展类型和全文搜索;上一个版本仍缺乏这两项功能。

为ClustrixDB添加节点可以扩展读写。ClustrixDB允许集群跨多个区域部署,以便在非计划区域故障期间提供容错功能。在独立实验室(但不是《InfoWorld》)运行的测试)中,ClustrixDB能够以15毫秒的延迟每秒处理4万个事务,其负载是90%的读取和10%的写入,为其提供了适用于电子商务的“网络星期一”可扩展性。

CockroachDB

CockroachDB是一种可横向扩展、与PostgreSQL兼容的开源分布式SQL数据库,由熟悉Google Cloud Spanner的前谷歌员工开发。CockroachDB借鉴了Spanner的数据存储系统设计,并使用Raft算法在其节点之间达成共识。CockroachDB不需要GPS和同步Spanner的原子钟。

CockroachDB立足于事务性一致性的键值存储系统RocksDB上。CockroachDB背后的主要设计目标是支持ACID事务、横向扩展性和(最重要的)生存性,因此得名。CockroachDB默认使用可序列化隔离模式,这胜过其他大多数数据库实施的隔离机制。

我在2018年初测试CockroachDB时,其JOIN性能不是很好。从那以后,这点已得到解决。CockroachDB支持将集群分散在多个可用区上,还在谷歌云平台和AWS上提供全面托管的云数据库集群。

Google Cloud Spanner

Google Cloud Spanner是一种托管分布式数据库,拥有NoSQL数据库的可扩展性,同时保留了SQL兼容性、关系模式、ACID事务和外部一致性。Spanner看起来像是颠覆了CAP定理。

Spanner是分片、全局分布、复制的,使用Paxos算法在节点之间达成共识。Spanner使用分两个阶段的提交以确保强一致性,但将Paxos组视为事务的成员。每个Paxos组只需要额定数(quorum),而不是需要100%的成员。

在谷歌内部使用时,Spanner的可用性超过五个9,即高于99.999%,这意味着每年停机时间不到5分钟。这足以让大多数程序员通常不必为编写代码来处理Spanner可用性故障而操心。

Spanner使用Google Common SQL,这是ANSI 2011 SQL的一种方言。Common SQL与PostgreSQL、MySQL、SQL Server或Oracle Database使用的任何SQL方言都不完全相同,数据类型略有不同,数据操纵方面大不相同。

原文标题:The best distributed relational databases,作者:Martin Heller

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

责任编辑:庞桂玉 来源: 51CTO
相关推荐

2022-06-09 10:19:10

分布式数据库

2013-04-26 16:18:29

大数据全球技术峰会

2009-10-23 10:45:21

NoSQLMemcached关系数据库

2022-05-31 07:58:49

TiDB数据库开源

2018-06-07 08:31:33

Oracle分布式内存

2014-06-30 14:20:05

NoSQL数据库

2017-07-07 14:41:43

阿里云分布式关系

2021-11-08 10:52:02

数据库分布式技术

2018-06-05 14:21:33

NewSQLMySQLRadonDB

2019-12-18 10:24:10

数据库PostgreSQL Oracle

2023-11-14 08:24:59

性能Scylla系统架构

2023-07-31 08:27:55

分布式数据库架构

2015-06-16 10:39:43

NoSQL分布式算法

2023-07-28 07:56:45

分布式数据库SQL

2023-06-01 07:30:42

分析数据源关系型数据库

2021-12-20 15:44:28

ShardingSph分布式数据库开源

2023-03-26 12:43:31

数据库KeyValue

2021-08-30 11:21:03

数据库工具技术

2023-12-05 07:30:40

KlustronBa数据库

2022-12-08 08:13:11

分布式数据库CAP
点赞
收藏

51CTO技术栈公众号