CAP,能少了P?你知道吗?

网络 通信技术
由于网络通信肯定会出现延迟丢包等问题,所以一般情况而言,分区容错性是必须实现的。那么分布式系统会在一致性和可用性之间进行权衡, 即C和A之间的选择。

哈喽,大家好,我是指北君。

大型网站几乎都是分布式系统,分布式系统也越来越重要,你也会发现周围的许多事物已经是分布式理论的最佳实践了。

前言

分布式系统(distributed system)主要有三个指标 一致性 (Consistency),可用性(Availability),分区容错性(Partition tolerance)。

一致性是指更新操作成功后,所有节点在同一时间的数据完全一致。

可用性是指用户访问数据时,系统是否能正常响应时间内返回数据。

分区容错性是指分布式系统在遇到某个节点或网络分区故障时,仍然能够对外提供满足一致性和可用性的服务。

CAP理论基本可以定义为,以上的三个指标不能全部做到,即只能同时满足CA, CP, AP。

1. 分区容错性

分布式系统存在多个子系统,每个子系统子网络可以叫做区。各个节点之间的数据需要同步,子系统之间也需要通信。而分区容错指的是某个节点出现故障,而整个服务不会受到大的影响。

若一个服务为单节点服务,那么它可以说是满足CA。

C表示任何时间点读取的数据都是相同的,保证了一致性。

A表示只要有节点可以用,那么就可以提供服务

由于是单节点服务,那么总是满足CA的条件。

而在分布式系统中,大多时候,单节点出问题之后,我们是需要保障整个系统都是可以使用的。所以可以认为CAP中的P总是需要成立的。

2. 一致性

一致性指的是分布式系统中所有节点在同一时间访问时,返回数据完全一致。

从客户端看,就是并发访问时获取数据的一致性。

服务端来看,就是数据节点之间的同步问题,即节点之间通过通信保持数据的实时更新。

也有对一致性分成强,弱以及最终一致性三类。

强一致性 要求数据更新后,对于其他节点,必须立马同步,并可见。

弱一致性 可以允许在数据更新后,部分节点不能访问到最新的数据。

最终一致性 要求一段时间内不能访问最新数据,但是一段时间后,分布式系统的所有数据需要统一

3. 可用性

相对来说,可用性比较容易理解,就是说任何时候,我们都可以从系统中获取数据。系统可以提供正常的用户服务。不会出现操作失败,访问超时等情况

总结

由于网络通信肯定会出现延迟丢包等问题,所以一般情况而言,分区容错性是必须实现的。那么分布式系统会在一致性和可用性之间进行权衡, 即C和A之间的选择。

CP without A  即要求一致性,每个请求都要求服务之间保持强一致性,分区则会使同步时间无限延长,如果网络严重故障,消息丢失的情况下,用户体验差,需要全部数据一致后才能提供访问。比如Redis,Hbase 等就会要求数据一致性。Zookeeper 也是遵循CP原则,Leader节点挂掉之后,集群会进行选举,选举期间整个Follower都是不可用的,需要同步数据,所以需要Zookeeper恢复之后才可以使用。

AP without C 即要求高可用而且可以分区,此时需要放弃一致性。分区节点出现故障时,为了满足高可用,每个节点只能使用本地的数据提供访问,避免服务中断。这种典型的应用就是抢票等情形,前一秒还有票,当我输入验证码之后再点击,票已售罄。心里的草泥马无限增生。Eureka是采用AP原则,牺牲一致性,达到可用性的目的。

在一致性方面做出让步之后,有些系统会实现最终一致性,尽力保证整个系统的数据一致性。

分布式系统的一致性和可用性之间的选择没有固定的搭配,而需要根据不同的业务场景进行选择,吹牛没用,合适才行。

责任编辑:武晓燕 来源: Java技术指北
相关推荐

2023-12-20 08:23:53

NIO组件非阻塞

2023-04-26 10:21:04

2024-04-30 09:02:48

2023-12-12 08:41:01

2024-04-07 00:00:00

ESlint命令变量

2024-05-28 09:12:10

2023-05-05 09:04:41

文本数据ChatGPT

2022-03-10 08:25:27

JavaScrip变量作用域

2017-10-16 13:45:04

2019-12-12 09:23:29

Hello World操作系统函数库

2019-06-14 15:36:13

Windows 10安全PC

2022-05-27 08:55:15

工具自动化软件

2021-02-02 08:21:28

网络面试通信

2020-10-28 11:20:55

vue项目技

2021-12-08 07:31:40

Linux安全病毒

2024-07-30 08:22:47

API前端网关

2021-02-20 08:21:18

Hive动态分区

2024-11-08 09:48:38

异步编程I/O密集

2024-08-20 08:29:55

2024-04-07 00:00:03

点赞
收藏

51CTO技术栈公众号