面试官：对于 MQ 中的消息丢失你是如何理解的？-51CTO.COM

相信很多的小伙伴在面试的时候，涉及到MQ的面试题，消息丢失是必问面试题之一。那么对于消息丢失你又是如何理解的呢？

下面我们一起来看一下。

本文以 Kafka 举例说明。

消息丢失的定义是：在消息传递的过程中，在某个环节意外丢失，也就是消息没有成功的发送或者没有被正确的接收。

生产者未能成功发送消息。

消费者未能正确接收消息。

消费者未能正确处理消息。

对于第三条可以理解为特殊的消息丢失，因为消费者的逻辑处理错误，程序bug等其他原因，造成消息在处理过程中消息丢失或者被忽略（异常之后错误的应答等），也就是说消息没有正确的被消费掉，我们也可以认为是一种消息丢失。

(1) 配置正确的主体、分区、以及TTL。

(2) 使用ACK应答，等待消息被MQ写入成功之后在确认为发送成功。

(3) 消息发送重试。

(4) 配置合理的压缩策略。

(5) 设置合理的消息缓冲区大小。

(6) 使用合适的序列化器，防止序列号错误造成消息丢失。

其他的配置可以参考官网 Kafka 生产者配置：https://kafka.apache.org/documentation/#producerconfigs

(1) 编写健壮的代码，说的容易，写起来还是得多测试。对于可能产生的异常原因进行分析处理。当发生异常时，可以做如下处理：

(2) 使用手动提交偏移量。（需保证所有的异常情况代码中都有对应的异常处理机制，也就是第一点，健壮的代码）

(3) 使用自动提交偏移量。（需要保证消费逻辑正确）

(4) 使用监控，监控消费者的消费情况，发现异常立即上报。

(5) 正确的消费者组管理，类似消费者重平衡或者重启等造成的消息偏移量丢失。

(6) 备份，发生异常或者消息丢失时，可以跟踪到消费者的消费情况，直接使用备份恢复。

上面我们分析了什么是消息丢失，产生的原因有哪些以及如何解决。通过看完这篇文章相信你对Kafka中的消息丢失也有了一定的了解，在工作中使用的时候也就不会没有底气了。

相信有眼尖的小伙伴发现了，在消费者的处理逻辑中，多次消费会造成消息的多次重复消费。消息的重试也有可能造成消息的堆积。那么这些问题就是下节课我们要说的。