被问到MQ消息已丢失,该如何处理?

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 在分布式系统中,消息中间件(如RabbitMQ、Kafka等)用于解耦生产者和消费者,确保数据传输的可靠性和顺序性。尽管有多种措施防止消息丢失,如消息持久化、手动确认机制和重试机制,但消息丢失仍可能发生。本文探讨了四种常见丢失场景及补救措施:1. 生产者发送消息失败;2. 消息在传输过程中丢失;3. 消息中间件内部丢失;4. 消费者未处理完消息前丢失。针对每种场景,提出了相应的解决方案,如消息重发、本地存储、日志记录、高可用配置、死信队列等,以确保系统的可靠性和稳定性。

在分布式系统中,消息中间件(如 RabbitMQ、RocketMQ、Kafka、Pulsar 等)扮演着关键角色,用于解耦生产者和消费者,并确保数据传输的可靠性和顺序性。尽管我们通常会采取多种措施来防止消息丢失,如消息持久化、手动确认机制和重试机制等,但如果消息已经丢失了这种情况,当丢失已经发生又应该如何处理呢?下面我们探讨可能的丢失场景及相应的补救措施。


添加图片注释,不超过 140 字(可选)


1. 生产者发送消息失败


添加图片注释,不超过 140 字(可选)


场景: 生产者在发送消息到消息中间件时失败,消息没有成功进入队列。

补救措施:

  • 消息重发: 生产者实现重试,在发送消息失败时进行多次重试,确保消息最终被成功发送。
  • 本地存储: 在发送消息失败时,将消息保存到本地存储(如数据库或文件),稍后再尝试发送,确保消息不会丢失。
  • 日志记录: 记录发送失败的日志信息,以便后续排查和处理。


2. 消息在传输过程中丢失


添加图片注释,不超过 140 字(可选)


场景: 消息在从生产者到消息中间件,或者从消息中间件到消费者的传输过程中丢失。

补救措施:

  • 消息重发:和第一种情况类似,由生产者实现消息重发,也就是再次发起业务。


3. 消息中间件内部丢失


添加图片注释,不超过 140 字(可选)


场景: 消息中间件由于内部故障(如节点崩溃、磁盘故障等)导致消息丢失。

补救措施:

  • 高可用配置: 一般来说消息中间件都会配置集群,当然集群的方案可能会不同,但如果是配置了高可用集群,此时是主节点挂了可以通过多节点冗余和数据复制来提高系统的容错能力。在某个节点发生故障时,可以从其他节点恢复数据。
  • 日志记录: 日志记录系统操作和状态变化,通过重放日志可以在节点故障后恢复数据。
  • Kafka 事务日志: Kafka 使用事务日志记录所有消息操作,故障恢复时可以重放日志来恢复消息。
  • RabbitMQ 消息日志: 配置 RabbitMQ 记录消息操作日志,重启节点后可以从日志中恢复消息。
  • 备份与恢复:定期备份消息和队列状态,当发生硬件故障时,可以从备份中恢复数据。

4. 消费者未处理完消息前丢失


添加图片注释,不超过 140 字(可选)


场景: 消费者收到消息后,在处理消息的过程中发生异常,导致消息丢失。

补救措施:

  • 消息重发:由生产者实现消息重发,也就是再次发起业务。当然这种方式得生产者进行配合,有时比较深的业务链某个环节出现丢失,要重新发送的代价也会比较高。当然如果业务简单重发也是比较简单的。
  • 未确认消息重发: 如果是消费者在处理消息时不会自动ACK或未发送ACK给消息中间件情形,此时消息中间件会将未确认的消息重新放回队列,重新投递给其他消费者或同一个消费者进行处理。
  • 死信队列:若是消息处理失败超过一定次数或消息在队列中停留超过一定时间时,此时消息转移到死信队列。消费者可以从死信队列中找回消息。


尽管我们可以采取多种预防措施来防止消息丢失,但消息丢失仍然可能发生。在消息已经丢失的情况下,我们需要快速识别丢失的场景,并采取相应的补救措施。

相关实践学习
快速体验阿里云云消息队列RocketMQ版
本实验将带您快速体验使用云消息队列RocketMQ版Serverless系列实例进行获取接入点、创建Topic、创建订阅组、收发消息、查看消息轨迹和仪表盘。
消息队列 MNS 入门课程
1、消息队列MNS简介 本节课介绍消息队列的MNS的基础概念 2、消息队列MNS特性 本节课介绍消息队列的MNS的主要特性 3、MNS的最佳实践及场景应用 本节课介绍消息队列的MNS的最佳实践及场景应用案例 4、手把手系列:消息队列MNS实操讲 本节课介绍消息队列的MNS的实际操作演示 5、动手实验:基于MNS,0基础轻松构建 Web Client 本节课带您一起基于MNS,0基础轻松构建 Web Client
目录
相关文章
|
安全 Java 数据安全/隐私保护
SpringBoot实现二维码扫码登录的原理与详细步骤
SpringBoot实现二维码扫码登录的原理与详细步骤
1100 1
|
4月前
|
消息中间件 缓存 监控
MQ消息积压 / Rocketmq 积压 最全的处理方案。 (秒懂+图解+史上最全)
MQ消息积压 / Rocketmq 积压 最全的处理方案。 (秒懂+图解+史上最全)
MQ消息积压 / Rocketmq 积压 最全的处理方案。 (秒懂+图解+史上最全)
|
canal 缓存 NoSQL
Redis缓存与数据库如何保证一致性?同步删除+延时双删+异步监听+多重保障方案
根据对一致性的要求程度,提出多种解决方案:同步删除、同步删除+可靠消息、延时双删、异步监听+可靠消息、多重保障方案
Redis缓存与数据库如何保证一致性?同步删除+延时双删+异步监听+多重保障方案
|
7月前
|
存储 安全 Java
ThreadLocal - 原理与应用场景详解
ThreadLocal是Java中用于实现线程隔离的重要工具,为每个线程提供独立的变量副本,避免多线程数据共享带来的安全问题。其核心原理是通过 ThreadLocalMap 实现键值对存储,每个线程维护自己的存储空间。ThreadLocal 广泛应用于线程隔离、跨层数据传递、复杂调用链路的全局参数传递及数据库连接管理等场景。此外,InheritableThreadLocal 支持子线程继承父线程的变量值,而 TransmittableThreadLocal 则解决了线程池中变量传递的问题,提升了多线程上下文管理的可靠性。深入理解这些机制,有助于开发者更好地解决多线程环境下的数据隔离与共享挑战。
1535 43
|
消息中间件 存储 Java
吃透 RocketMQ 消息中间件,看这篇就够了!
本文详细介绍 RocketMQ 的五大要点、核心特性及应用场景,涵盖高并发业务场景下的消息中间件关键知识点。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
吃透 RocketMQ 消息中间件,看这篇就够了!
|
消息中间件 中间件 Kafka
分布式事务最全详解 ,看这篇就够了!
本文详解分布式事务的一致性及实战解决方案,包括CAP理论、BASE理论及2PC、TCC、消息队列等常见方案,助你深入理解分布式系统的核心技术。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
分布式事务最全详解 ,看这篇就够了!
|
存储 关系型数据库 MySQL
MySQL - 聚簇索引和非聚簇索引
MySQL - 聚簇索引和非聚簇索引
552 0
|
消息中间件 存储 程序员
RabbitMQ消息丢失的场景,如何保证消息不丢失?(详细讲解,一文看懂)
RabbitMQ消息丢失的场景,如何保证消息不丢失?(详细讲解,一文看懂)
705 0
RabbitMQ消息丢失的场景,如何保证消息不丢失?(详细讲解,一文看懂)
|
存储 消息中间件 JSON
DDD基础教程:一文带你读懂DDD分层架构
DDD基础教程:一文带你读懂DDD分层架构
|
Java 编译器 Spring
面试突击78:@Autowired 和 @Resource 有什么区别?
面试突击78:@Autowired 和 @Resource 有什么区别?
16298 6