Kafka 如何保证消息消费的全局顺序性

云计算 Kafka
由于相同的 key 就发送到同一分区,这样就能够保证了消费的消息是有序的。然而,如果只有一个消费者消费相同 key 的消息,与前面单分区相比没有什么区别

哈喽大家好,我是咸鱼

今天我们继续来讲一讲 Kafka

当消息被生产出来的时候,如果没有指定分区或者指定 key ,那么消费会按照【轮询】的方式均匀地分配到所有可用分区中,但不一定按照分区顺序来分配

图片图片

我们知道,在 Kafka 中消费者可以订阅一个或多个主题,并被分配一个或多个分区

图片图片

如果一个消费者消费了多个分区,某些场景下消费者需要顺序地消费消息,但消息并不是按照顺序分配给分区的,所以就不一定能够保证消息消费的全局顺序性

比如下图中 Msg0002 消息并不是在 Msg0001 消息之后的,就有可能导致消费者先把 Msg0002 消息给消费, Msg0001 消息才被消费

图片

那么这种情况该怎么解决?如何尽可能地保证消息消费的全局顺序性?要想消费消息 B 必须先消费消息 A

要注意的是,Kafka 的设计目标是提供高吞吐量和低延迟,而不是强制保证全局有序性

所以这篇文章探讨的是需要强调全局顺序性场景下的 Kafka 应用

单分区

最简单粗暴的方法,虽然 Kafka 不能保证全局消费顺序性,但是能够保证分区内的消息顺序性

图片图片

所以我们可以只创建一个分区,并让消费者消费这个分区,这样就能够保证消费的消息是有序的

但是这样做大大降低了吞吐量和处理效率,容易使得性能出现瓶颈

基于 key 的消息分配策略

在 Kafka 中,基于 key 的消息分配策略是通过消息中的键(key)来确定消息发送到哪个分区

当生产者发送消息时,可以指定一个键(key),Kafka 使用这个键通过哈希算法来确定消息被发送到哪个分区

图片图片

由于相同的 key 就发送到同一分区,这样就能够保证了消费的消息是有序的

然而,如果只有一个消费者消费相同 key 的消息,那么与单分区相比,基于 key 的消息分配策略不会提高吞吐量

因为即使相同 key 的消息在多个分区中,但同一消费者依然只能从一个分区中消费,这并不会增加整体的处理能力。

但如果有多个消费者消费相同 key 的消息,基于 key 的分区策略可以提高消费者并行消费的能力

图片图片

因为这些消费者可以同时从不同分区中读取消息,从而增加整体的处理速度。这种情况下,基于 key 的消息分配可以提高整体吞吐量

最后总结一下:

  • Kafka 的设计目标是提供高吞吐量和低延迟,而不是强制保证全局有序性,所以Kafka使用多分区的概念,并且只保证单分区有序
  • 如果想要实现消息的全局有序

单分区策略:一个主题下只创建一个分区,一个消费者只消费一个分区,但这样做毫无并发性可言,极大降低系统性能

基于 key 的消息分配策略:由于相同的 key 就发送到同一分区,这样就能够保证了消费的消息是有序的。然而,如果只有一个消费者消费相同 key 的消息,与前面单分区相比没有什么区别

责任编辑:武晓燕 来源: 咸鱼运维杂谈
相关推荐

2023-12-04 09:23:49

分布式消息

2024-06-27 08:00:17

2019-03-25 07:39:35

ID串行化消息顺序性高可用

2021-02-02 11:01:31

RocketMQ消息分布式

2024-05-09 08:04:23

RabbitMQ消息可靠性

2021-04-27 07:52:18

RocketMQ消息投递

2023-09-21 09:02:03

RocketMQ全局有序局部有序

2024-06-18 08:26:22

2021-09-13 07:23:53

KafkaGo语言

2023-12-15 13:08:00

RocketMQ中间件消费顺序

2023-12-18 09:46:13

Kafka集群开发

2024-06-05 06:37:19

2021-03-04 06:49:53

RocketMQ事务

2024-03-20 08:33:00

Kafka线程安全Rebalance

2019-01-10 09:11:51

消息顺序性分布式服务端

2023-03-06 08:16:04

SpringRabbitMQ

2020-03-12 09:34:05

Redis数据技术

2020-10-14 08:36:10

RabbitMQ消息

2024-07-04 12:36:50

2021-04-14 17:18:27

幂等性数据源MySQL
点赞
收藏

51CTO技术栈公众号