面试官:同一个消费组内的消费者,如果订阅了相同的 topic,但是订阅的 tag 不一样,会有什么问题吗?
我:会出现丢消息的情况。
面试官:能详细说一说吗?
我:RocketMQ 要求同一个消费组内的消费者必须订阅关系一致,如果订阅关系不一致,会出现消息丢失的问题。
面试官:什么是订阅关系一致呢?
我:订阅关系一致是指同一个消费者组下所有消费者所订阅的 Topic、Tag 必须完全一致。如下图所示:
其中,消费组 1 中的消费组都订阅了 Topic1 中的 Tag1,消费组 2 中的消费组都订阅了 Topic1 中的所有 Tag 以及 Topic2 中的 Tag1 || Tag2,消费组 3 中的消费组都订阅了 Topic2 中的 Tag1 和 Tag2。
面试官:能举几个订阅关系不一致的例子吗?
我:订阅不一致的情况有三种,如下图:
消费组 1 的 Consumer1 和 Consumer2 都订阅了 Topic1,但是订阅的 Tag 不一致。
消费组 2 的 Consumer1 和 Consumer2 订阅的 Topic 不一致。
消费组 3 的 Consumer1 和 Consumer2 订阅的 Topic 和 Tag 都一致,但是订阅 Tag 的顺序不一致。
面试官:为什么订阅关系不一致会导致消息丢失呢?
我:RocketMQ 的存储架构,如下图:
为了 提高消费效率,RocketMQ 引入了 ConsumeQueue,ConsumerQueue 中保存消息在 CommitLog 文件中的物理偏移量。ConsumerQueue 中的元素内容如下:
- 前 8 个字节记录消息在 CommitLog 中的偏移量。
- 中间 4 个字节记录消息消息大小。
- 最后 8 个字节记录消息中 tag 的 hashcode。
这个 tag 的作用是过滤消息,假如一个 Consumer 订阅了 Topic1 中的 Tag1,那这个 Consumer 拉取消息时,首先从 Name Server 获取订阅关系,得到当前 Consumer 订阅的所有 tag 的 hashcode 集合 codeSet。每次从 ConsumerQueue 获取一条记录,就要判断最后 8 个字节 tag hashcode 是否在 codeSet 中,比如 Tag2 不在 codeSet 中,就会被过滤掉。如下图:
消费组 1 消费 Topic1 中的消息时,Consumer1 通过 ConsumeQueue1 和 ConsumeQueue2 进行消费,Consumer2 通过 ConsumeQueue3 和 ConsumeQueue4 进行消费,如果 Consumer1 订阅了 Tag1, Consumer2 订阅了 Tag2,那 Consumer1 从 ConsumeQueue1 和 ConsumeQueue2 消费消息时,就会把 Tag2 中的消息过滤掉,这样即使 Consumer2 订阅了 Tag2,也不能消费到 ConsumeQueue1 和 ConsumeQueue2 里 Tag2 中的消息了。
面试官:有没有方法可以快速知道消费组中有没有订阅关系不一致的问题?
我:可以在 RocketMQ 的控制台看到。在 RocketMQ 的实例列表中,进入 Group 管理页面,查看要查找的 Group ID,查看详情,如下图:(下图来自阿里云)
面试官:恭喜你,通过了。