MQ系列10:如何保证消息幂等性消费

mq,系列,如何,保证,消息,消费 · 浏览次数 : 1548

小编点评

**1. 消息中间件执行原理** 消息中间件是应用程序之间通信中的一种中介,它可以将来自多个应用程序的消息传递到其他应用程序。消息中间件负责将消息从一个应用程序传递到另一个应用程序,并确保消息的可靠性。 **2. 消息队列中如何保证幂等性** 消息队列中如何保证消息的幂等性取决于其实现方式。一般来说,消息队列会使用以下几种技术来实现幂等性: * **超时重试:**在发送消息之前,消息队列会设置一个超时时间,如果消息超过该时间还没有收到回复,则认为消息发送失败,并重新发送。 * **异常重试:**在发送消息之前,消息队列会设置多个异常处理器,如果任何异常发生,消息会被重新发送。 * **消费完成确认:**在消费消息之前,消息队列会向发送方发送一个确认信息,表明该消息已成功消费。 * **消息id:**在发送消息之前,消息队列会为消息分配一个 unique 的消息id,作为去重的依据,用于防止重复消费。 **3. RocketMQ 架构分析** RocketMQ 是一个基于 Redis 的消息中间件,它采用 Actor 设计,使用多个 Actor 来实现消息队列的功能。 * **NameServer:** NameServer 是 RocketMQ 的 central hub,它负责注册和发现 brokers,并维护消息队列的配置。 * **Broker:** Broker 是消息服务器,负责存储和发送消息。 * **Producer:** Producer 是消息生产者,负责生产消息并将其发送给 broker。 * **Consumer:** Consumer 是消息消费者,负责从 broker 中获取消息并进行处理。 **4. NameServer 原理解析** NameServer 是 RocketMQ 的核心组件,它负责以下任务: * **注册和发现 brokers:** NameServer 将从注册中心(如 Consul)中发现所有可用的 brokers。 * **维护消息队列的配置:** NameServer 负责维护消息队列的配置,如队列名称、副本数等。 * **协调 broker之间的通信:** NameServer 负责协调 broker之间的通信,如如何处理消息、如何处理异常等。 **5. 总结** 消息中间件是应用程序之间通信中的一种重要组件,它可以确保消息的可靠性和有序性。RocketMQ 是一个基于 Redis 的消息中间件,它采用 Actor 设计,使用多个 Actor 来实现消息队列的功能。

正文

MQ系列1:消息中间件执行原理
MQ系列2:消息中间件的技术选型
MQ系列3:RocketMQ 架构分析
MQ系列4:NameServer 原理解析
MQ系列5:RocketMQ消息的发送模式
MQ系列6:消息的消费
MQ系列7:消息通信,追求极致性能
MQ系列8:数据存储,消息队列的高可用保障
MQ系列9:高可用架构分析

1 介绍

我们实际系统中有很多操作,不管你执行多少次,都应该产生一样的效果或返回一样的结果。 例如:

  • 前端页面重复提交选中的数据,服务端只产生对应这个数据的一个反应结果,只保存一次数据。
  • 我们发起一笔付款请求,也只能扣用户账户一次钱,即使遇到网络重发或系统bug重发,也应该只扣一次金额。
  • 消息通知,也应该只能收到一次,如果收到多次的扣款通知短信,会让用户误解的。
  • 创建商品订单,一次业务请求只能创建一个,创建多个就会变成购买多次,就会出问题。

以上等等很多重要的场景,都需要幂等的特性来支持。

幂等(idempotent、idempotence)是一个数学与计算机学概念,常见于抽象代数中。 在编程中.一个幂等操作的特点是其任意多次执行所产生的影响均与一次执行的影响相同。幂等函数,或幂等方法,是指可以使用相同参数重复执行,并能获得相同结果的函数。这些函数不会影响系统状态,也不用担心重复执行会对系统造成改变。
例如,“getUserSex()和setRight()”函数就是一个幂等函数,包括数据库中的查询和删除也是一样的道理,它是天然幂等的。总之,幂等就是一个操作,不论执行多少次,产生的效果和返回的结果都是一样的 。

2 消息队列中如何保证幂等性

2.1 消息队列的基本构成

我们先来回顾下 Message Queue的构成,这边以RocketMQ为例子:
RocketMQ主要有四大核心组成部分:NameServer、Broker、Producer以及Consumer四部分。

  • NameServer:Name Server是一个几乎无状态节点,可集群部署,节点之间无任何信息同步。NameServer 是整个 RocketMQ 的 "中央大脑 " ,它是 RocketMQ 的服务注册中心,所以 RocketMQ 需要先启动 NameServer 再启动 Rocket 中的 Broker。
  • Broker: 消息服务器,作为Server提供消息核心服务, 它接收并存储Producer生产的消息,也提供消息给Consumer消费。Broker一般会分主从,Master 可读可写,Slave 只读。
  • Producer: 消息生产者,消息的发送方,负责生产消息传输给broker。RocketMQ提供了发送:同步、异步和单向(one-way)的多种模式。
  • Consumer: 消息消费者,消息的处理方,负责从broker获取消息并进行业务逻辑处理。
    另外其他如 Topic、 Message,也是重要的组成部分:
  • Topic:主题,发布/订阅模式下的消息统一汇集地,不同生产者向topic发送消息,由MQ服务器分发到不同的订阅者,实现消息的广播
  • Message:消息体,根据不同通信协议定义的固定格式进行编码的数据包,来封装业务数据,实现消息的传输。

image

2.2 消息队列的幂等分析

可以看出,消息发送和消息消费两个步骤是有可能产生消息不幂等的问题。
为保证消息的正确性发送,超时重试、异常重试、消费完成确认机制等能力都是可以使用,并对业务产生影响的。
我们举个例子,如果你购买一件商品,用户付款完成之后,通过MQ消息的异步通知,告知下游服务出库和通知。如果消息通知出现了问题或者下游消息消费出现了问题,导致无法ACK,都有可能导致重复的出库和通知。
image

2.2.1 消息生产的幂保证

MQ消息生产部分,就是下图中的步骤1、步骤2、步骤3:

  • 步骤1:消息生产端 MQ-Client Producer 将消息发给服务端MQ-server
  • 步骤2:消息队列服务 MQ-Server 将消息持久化存储
  • 步骤3:息队列服务 MQ-Server 返回确认信息(ACK \ CONSUME_SUCCESS \ offset)给消息生产端 MQ-Client Producer

如果3 消息确认故障导致消息丢失,则消息生产端 MQ-Client Producer 超时后会重发消息,这时候可能就有重复消息,如何保证幂等呢?
因为消息重发也是MQ-Client Producer发起的,消息的处理是消息队列的服务MQ-Server处理的,MQ-Server将数据进行了持久化么,这时候我们可以设计一个唯一的 msgId,作为去重的依据,无论重发多少次,msgId都是一样的,然后在DB数据库中将这个msgId设置为unique key,不允许重复,他有如下特性:

  • 全局唯一,不允许重复
  • MQ生成与业务无耦,对消息的生产和消费也是无强相关。

使用这个 msgId,可以保证只有1条消息落地到数据库中,就保证了消息生产端的幂等。
image

2.2.2 消息消费的幂保证

MQ消息消费部分,就是下图中的步骤4、步骤5、步骤6:

  • 步骤4:消息队列服务 MQ-Server 将消息发给给消费端 MQ-Client Consumer
  • 步骤5:消费端 MQ-Client Consumer 返回确认信息 (ACK \ CONSUME_SUCCESS \ offset) 给 消息队列服务
  • 步骤6:消息队列服务 MQ-Server 将持久化的消息数据删除,根据msgId精确删除

★ 说明:以上步骤须做一致性保障

这边重灾区就是步骤5,如果因为故障导致消息丢失,消息队列服务 MQ-Server 在超时后会重发消息,这样 MQ-Client Producer/Consumer 就会重复收到消息。
因为消息重发是 消息队列服务 MQ-Server 发起的,MQ-Client Consumer 负责消息消费,消息重发必然会导致业务重复消费(比如重复发消息、重复出库)。所以一样的道理,必然使用msgId来做判断,如果存在库中就进行消费,然后精确删除库中的数据。如果数据库中不存在,就忽略,避免重复消费。
同样的,这个msgID的特性如下:

  • 全局唯一,不允许重复
  • MQ生成与业务无耦,对消息的生产和消费也是无强相关。
  • 业务消息消费方 MQ-Client Consumer 负责判重,保证幂等性

这种方式最常见应用在:商品下单、消费支付、帖子点赞和留言等。

image

2.3 总结说明

无论是何种消息队列,造成重复消费原因其实都是类似的。正常情况下,消费者在消费消息时候,消费完毕后,会发送一个确认信息给消息队列,消息队列就知道该消息被消费了,就会将该消息从消息队列中删除。
只是不同的消息队列发送的确认信息形式不同,例如RabbitMQ是发送一个ACK确认消息,RocketMQ是返回一个CONSUME_SUCCESS成功标志,kafka实际上有个offset的概念,每一个消息都有一个offset,kafka消费过消息后,需要提交offset,让消息队列知道自己已经消费过了。
那造成重复消费的原因? 就是因为网络传输等等故障,确认信息没有传送到消息队列,导致消息队列不知道自己已经消费过该消息了,再次将该消息分发给其他的消费者。
如何解决?这个问题针对业务场景来答分以下几点
(1)给这个消息做一个唯一主键,做数据库insert,如果出现重复消费情况,会导致主键冲突,避免数据库出现脏数据。
(2)update 和 delete 支持天然幂等性,拿到这个消息做redis的set的操作,那就容易了,不用解决,set操作天然幂等操作。
(3)第三方介质,来做消费记录。以redis为例,给消息分配一个全局id,只要消费过该消息,将<id,message>以K-V形式写入redis。那消费者开始消费前,先去redis中查询有没消费记录即可。

与MQ系列10:如何保证消息幂等性消费相似的内容:

MQ系列10:如何保证消息幂等性消费

MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析 MQ系列5:RocketMQ消息的发送模式 MQ系列6:消息的消费 MQ系列7:消息通信,追求极致性能 MQ系列8:数据存储,消息队列的高可用保障 M

MQ系列7:消息通信,追求极致性能

MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析 MQ系列5:RocketMQ消息的发送模式 MQ系列6:消息的消费 1 介绍 前面的章节我学习了 NameServer的原理,消息的生产发送,以及消息

MQ系列8:数据存储,消息队列的高可用保障

MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析 MQ系列5:RocketMQ消息的发送模式 MQ系列6:消息的消费 MQ系列7:消息通信,追求极致性能 1 介绍 在之前的章节中,我们介绍了消息的发送

MQ系列9:高可用架构分析

MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析 MQ系列5:RocketMQ消息的发送模式 MQ系列6:消息的消费 MQ系列7:消息通信,追求极致性能 MQ系列8:数据存储,消息队列的高可用保障 1

MQ系列11:如何保证消息可靠性传输(除夕奉上)

MQ系列1:消息中间件执行原理 MQ系列2:消息中间件的技术选型 MQ系列3:RocketMQ 架构分析 MQ系列4:NameServer 原理解析 MQ系列5:RocketMQ消息的发送模式 MQ系列6:消息的消费 MQ系列7:消息通信,追求极致性能 MQ系列8:数据存储,消息队列的高可用保障 M

MQ系列12:如何保证消息顺序性

[MQ系列1:消息中间件执行原理](https://www.cnblogs.com/wzh2010/p/15888498.html "MQ系列1:消息中间件执行原理") [MQ系列2:消息中间件的技术选型](https://www.cnblogs.com/wzh2010/p/15311174.htm

MQ系列13:消息大量堆积如何为解决

[MQ系列1:消息中间件执行原理](https://www.cnblogs.com/wzh2010/p/15888498.html "MQ系列1:消息中间件执行原理") [MQ系列2:消息中间件的技术选型](https://www.cnblogs.com/wzh2010/p/15311174.htm

MQ系列14:MQ如何做到消息延时处理

[MQ系列1:消息中间件执行原理](https://www.cnblogs.com/wzh2010/p/15888498.html "MQ系列1:消息中间件执行原理") [MQ系列2:消息中间件的技术选型](https://www.cnblogs.com/wzh2010/p/15311174.htm

MQ 消息队列 比较

为什么需要消息队列 削峰 业务系统在超高并发场景中,由于后端服务来不及同步处理过多、过快的请求,可能导致请求堵塞,严重时可能由于高负荷拖垮Web服务器。 为了能支持最高峰流量,我们通常采取短平快的方式——直接扩容服务器,增加服务端的吞吐量。 优点是显而易见的,短时间内吞吐量增加了好几倍,甚至数十倍。

MQ消息积压,把我整吐血了

前言 我之前在一家餐饮公司待过两年,每天中午和晚上用餐高峰期,系统的并发量不容小觑。 为了保险起见,公司规定各部门都要在吃饭的时间轮流值班,防止出现线上问题时能够及时处理。 我当时在后厨显示系统团队,该系统属于订单的下游业务。 用户点完菜下单后,订单系统会通过发kafka消息给我们系统,系统读取消息