RocketMQ 在物流行业的应用与运维

本文涉及的产品
性能测试 PTS,5000VUM额度
简介: 最佳实践丨RocketMQ 的能力与快递业务场景非常吻合,因此在快递行业的应用极为广泛,作为快递行业龙头企业,中通双11期间日均消息流转超过万亿。一起来了解中通是如何保证 MQ 服务器性能与数据可靠性吧!

本文作者:丁威 - 中通快递资深架构师,《RocketMQ技术内幕》作者,Apache RocketMQ社区首席布道师,公众号「中间件兴趣圈」维护者。

01 物流行业的业务特点

图片

物流行业有三大业务特点:业务量庞大、实效性容忍度高以及业务复杂度极高。

作为快递行业龙头企业,中通的日均订单量早已高达5000 万,双11期间可达日均到2亿+,日均消息流转超过万亿。

在快递行业的实际日常业务中,比如早上10点下单,可能需要下午2点钟揽件,因此我们能够容忍分钟级甚至小时级的延迟。针对包裹拦截、路由变更等场景需要保证一定的时效性,但大多情况下只需尽可能保证即可。

中通快递为加盟制,其转运中心、分布中心以及网点都不在一家公司,因此业务逻辑、管控、结算等都较为复杂。

快递行业的业务系统结算、订单、运单采集等等对解耦性要求很高。此外,双十一期间流量可能为平时的3-4倍,因此也需要应对突发流量的能力。而RocketMQ的能力与我们的业务场景非常吻合,因此在快递行业的应用也是极为广泛。

02 RocketMQ在订单中心运用案例

图片

中通基于RocketMQ构建订单中心的架构图如上。

用户在天猫或淘宝用电商平台进行下单后,订单会派至云服务器,中通自研的数据同步平台负责定位云服务器的变动日志,通过变动日志将其传入RocketMQ。

第二层链路为拼多多和京东等厂家,通过网关进入RocketMQ。

第三层为散件用户,也是通过网关进入RocketMQ。

流量到达RocketMQ以后,由订单域的消费者消费 消费者消息并写入数据库。后续的很多系统比如运单域、结算都需要这份数据,为了解耦,需要通过同步平台将数据在同步到另外topic,供各个业务系统进行订阅以及数据分发。

上述架构的关键在于如何保证 MQ 服务器性能与数据可靠性。比如 MQ 使用的刷盘策略是同步还是异步?是否开启transientStorePoolEnable提高性能?复制策略是同步还是异步?是否需要Dledger? 如何优雅运维?

图片

RocketMQ在4.5.0版本之前即支持主从同步,4.5.0版本之后引入Dledger多副本机制,支持了主从切换。一个复制组内有主节点和从节点,不同复制组之间负载均衡。通常情况下由主节点承担数据的读和写,当主节点较为繁忙时,读取可转发到从节点上。同时如果主节点故障,从节点依然能进行消费,以保证消息发送和消息消费的高可用。

一个复制组故障后,请求会全部打到另外的复制组上,导致其因流量过大而出现故障。因此,在实际环境中一般建议部署成四个复制组,以应对流量暴增的情况。

RocketMQ 4.5.0之后引入了Dledger多副本机制,支持主从切换,不同复制组之间依然负载均衡。主节点负责读和写,从节点只负责复制数据。当复制组内主节点宕机后,会在该复制组内出发重新选主,选主完成后即可继续提供消息写功能,不会将流量转移到别的复制组,保证了发送和消费的高可用。

但Dledger多副本机制依然存在缺点,三台机器中只有主节点才能读和写,从节点只负责切换,主节点承担了较大压力。如果能让从节点也承担读写请求,按照主从同步模型,主节点宕机后将请求转换到从节点上,才能实现真正的高可用。

物流行业一般选择主从同步模式,因为主从切换的意义不大,而且浪费机器。

图片

用户发送消息时,消息会先到broker master,然后存储到PageCache,再用同步或异步的方式写磁盘。为了保证消息绝对不丢,会使用同步刷盘,同时将数据复制到从节点。一份数据在多个地方存储,能够避免单点故障导致数据丢失。

Dledger模式是基于Raft协议的数据副本机制,要求复制组内超过一半的节点成功写入,数据才算写入成功,可以保证强一致性。

使用同步复制、同步刷盘,消息延迟一定会比不使用此模式更大。

RocketMQ为了提高写入性能,在内核层提供了读写分离的机制,引入了transientStorePoolEnable。默认情况下,消息会先进入PageCache,再通过同步/异步刷盘进入磁盘文件。而transientStorePoolEnable=true 时,消息会先进入堆外内存,然后通过FileChannel块提交的方式批量提交到FileChannel,再通过异步刷盘批量进入磁盘文件。

堆外内存技术可以保证数据常驻内存中,不会因为内存紧张而将数据交换到其他内存,做出这种方式,能够提高更高的写入性。同时,写入流程没有经过PageCache,但依然从PageCache读取,在内核层实现了读写分离的方式。其优点为性能较高,投入资源较少。缺点是容易丢消息,因为存在堆外内存中的消息可能会出现没有批量提交到磁盘的情况,从而造成消息丢失。

图片

性能与数据丢失如何权衡?

我们认为,性能要追求(资源投入少),数据库正确性也要保证。

首先考虑数据发生丢失的概率以及数据找回的成本是否可控,如果数据找回难度低,则毫不犹豫地选择性能优先。比如,数据存储在binlog中,一般保存 15 天。则该情况下集群可以使用异步复制和异步刷盘。并推荐开启transientStorePoolEnable=true。即使集群服务节点异常导致机器断电等情况造成消息丢失,依然可以通过消息回溯找到断电前的数据。且发生此类情况的概率较低,没有必要为低概率事件牺牲性能。

此外,应避免人为因素(集群运维)导致数据丢失,进一步降低人工介入次数。比如开启transientStorePoolEnable=true,堆外内存重启时导致数据丢失。发生上述情况时,可通过以下方案保证内存不丢失:

①关闭一组broker的写权限,只保留其读权限,即原先存在的消息依然可以消费。

②待broker写入TPS为0后,停止broker。

③运维操作结束后,启动broker。

④开启broker写权限。

消息发送者或消费者查询信息时,不会访问关闭了写权限的broker。比如有四台broker,每个broker有四个队列,关闭其中一台的写权限后,返回的只剩 12 个队列。通过此方式,可以平缓地将流量停止。流量停止后,堆外内存中的数据必然会被刷到磁盘中,以此保证数据不丢失。

图片

RocketMQ支持分区级别的顺序消费,以银行账户余额变更短信通知为例:

发送方按照key (银行账号)进行哈希取模,取完后变为q0、q1、q2、q3。然后保证同一 key 的消息能进入到同以队列,消费者使用顺序消费的模式能够保证单个分区中的消息按顺序依次进入。

RocketMQ主要通过锁一致来实现顺序消费。消费者在拉消息前,会先在broker服务器锁定队列,锁定成功则可以进行消费;否则不会消费,等待下一次消息队列。

消息进入pullRequest队列后,消费者首先会在本地锁定队列,比如消费者分到 q0 和q1,则会先申请 q0 的锁再进行消费以及申请 q1 的锁再进行消费。

上述流程中,RocketMQ只支持分区级的并发度。比如消费者被分配了 30 个线程,实际只能有两个线程同时工作。该策略会导致如果消息队列有积压,调整消费者线程数没有任何效果。

图片

破解并发度困境的关键词为:关联顺序性。

关联顺序性指同一个队列中不同账号的消息并发执行,同一队列中相同账号的消息串行执行。

如上图,以账户余额短信通知服务为例,q0队列中有1、3、5、3、9,只需要保证其中的1、3、5、9并行执行,而前后两个3按顺序执行即可。

图片

上图为顺序消费模型的优化方案。

定义一个线程池,消费时按哈希取模,使同 key 的消息进入同一线程,不同key的消息分散在所有线程池中。比如原先有10个线程,不够用则可增加至20个线程,即破解了并发度带来的困境。该模型下,并发度与队列无关,可任意根据需求设置并生效。且实现了无锁化设计,按 key 选择线程。

RocketMQ4.6.0版本提供了DefaultLitePullConsumer API,其功能与Kafka高度类似,实现了RocketMQ与Kafka的通用性。

图片

全链路压测的基本设计需求有两个点:

①隔离性:如何存储压测流量,使其与正式流量互不影响。

②上下文信息:链路中一部分接入而另一部分不接入的情况下,上下文信息如何存储?

我们主要通过影子topic和影子消费组实现了全链路压测方案。

如上图所示,消息发送到中通自研数据同步平台后,会判断其是否为压测数据。如果是,则发送至shadow_T_ORDER_TOPIC,否则发送至T_ORDER_TOPIC。

order_consumer中包含shadow_C_ORDER_CONSUMER和ORDER_CONSUMER,分别消费压测消息和非压测消息。没有接入全链路压测的消费者指消费非压测数据。通过以上方式,从消息发送和消息消费链路上实现了将流量分开。

同时,其他相关信息比如 ID 等会存储于RocketMQ的消息属性中。

未接入全链路压测的应用无法识别消息属性,因此也无法区分消息是否带有压测属性,会导致流量全部打到不接全链路压测的ORDER_CONSUMER,因此不适合用消息属性进行隔离。如果希望使用消息属性进行隔离,则数据必须全部是业务方会消费的消息。

03 中通基于RocketMQ平台化建设实践

中通基于RocketMQ的平台已经开源,开源地址如下:

https://github.com/ZTO-Express/zms

图片

在中通,目前生产环境中所有的kafka集群、RocketMQ集群、Zookeeper等就能可以直接通过页面操作的方式快速搭建一套集群。实现原理如下:

在页面上访问zms-portal来启动和停止服务进程,由zms-agent启动 supervisor 进程管理体系来启动和停止服务。安装过程中,将参数提供给zms-agent,再发送给supervisor启动脚本,以启动服务。

今年,中通计划实现关于MQ集群的容灾恢复策略,扩容、主题迁移,在平台上一键操作完成消费组迁移而无需执行其他运维命令等能力。

NameServer地址动态感知机制指:项目组使用ams-sdk进行消息发送,消息消费时无需感知nameserver地址,只需面对topic、消费组编程;若集群出现问题,可以无感知地实现topic和消费组从一个集群迁移至另外一个集群。

NameServer地址动态感知机制的实现原理如下:引用 ZK 存储元信息,zms-portal在新增、修改、删除时,会去操作Message集群,同时会将操作写入到 ZK,在 ZK 中存储 topic 属于哪个集群、nameserver 地址等。zms-client发送消息之前,会查询topic的元信息并根据元信息构建底层的发送者进行消息发送。

如果要从一个集群迁移到另一集群,可以先修改元信息并更新ZK,ZK 更新后,zms-client会订阅 topic 内容的变化,如果发生变化则通知 SDK 重新构建发送者,实现切换。

图片

中通实现了对集群、主题、消费组等的可视化监控与告警体系。此能力的实现主要通过zmsCollector服务监听ZMS节点的变更并返回集群数据,由Message Cluster收集集群指标、订阅客户端指标数据给zmsCollector,再存储至influxDB最终进行展示。

此外,RocketMQ 的客户端耗时等指标,我们也在zms-sdk那进行埋点,发送至Message Cluster后,由zmsCollector进行消费,然后发送给influxDB最终进行展示。

加入 Apache RocketMQ 社区

十年铸剑,Apache RocketMQ 的成长离不开全球接近 500 位开发者的积极参与贡献,相信在下个版本你就是 Apache RocketMQ 的贡献者,在社区不仅可以结识社区大牛,提升技术水平,也可以提升个人影响力,促进自身成长。

社区 5.0 版本正在进行着如火如荼的开发,另外还有接近 30 个 SIG(兴趣小组)等你加入,欢迎立志打造世界级分布式系统的同学加入社区,添加社区开发者微信:rocketmq666 即可进群,参与贡献,打造下一代消息、事件、流融合处理平台。

相关实践学习
消息队列RocketMQ版:基础消息收发功能体验
本实验场景介绍消息队列RocketMQ版的基础消息收发功能,涵盖实例创建、Topic、Group资源创建以及消息收发体验等基础功能模块。
消息队列 MNS 入门课程
1、消息队列MNS简介 本节课介绍消息队列的MNS的基础概念 2、消息队列MNS特性 本节课介绍消息队列的MNS的主要特性 3、MNS的最佳实践及场景应用 本节课介绍消息队列的MNS的最佳实践及场景应用案例 4、手把手系列:消息队列MNS实操讲 本节课介绍消息队列的MNS的实际操作演示 5、动手实验:基于MNS,0基础轻松构建 Web Client 本节课带您一起基于MNS,0基础轻松构建 Web Client
相关文章
|
4天前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
73 23
|
30天前
|
机器学习/深度学习 数据采集 运维
机器学习在运维中的实时分析应用:新时代的智能运维
机器学习在运维中的实时分析应用:新时代的智能运维
81 12
|
26天前
|
消息中间件 存储 监控
说说MQ在你项目中的应用(一)
本文总结了消息队列(MQ)在项目中的应用,主要围绕异步处理、系统解耦和流量削峰三大功能展开。通过分析短信通知和业务日志两个典型场景,介绍了MQ的实现方式及其优势。短信通知中,MQ用于异步发送短信并处理状态更新;业务日志中,Kafka作为高吞吐量的消息系统,负责收集和传输系统及用户行为日志,确保数据的可靠性和高效处理。MQ不仅提高了系统的灵活性和响应速度,还提供了重试机制和状态追踪等功能,保障了业务的稳定运行。
62 6
|
1月前
|
运维 监控 持续交付
自动化运维在现代数据中心的应用与实践####
本文探讨了自动化运维技术在现代数据中心中的应用现状与实践案例,分析了其如何提升运维效率、降低成本并增强系统稳定性。通过具体实例,展示了自动化工具如Ansible、Puppet及Docker在环境配置、软件部署、故障恢复等方面的实际应用效果,为读者提供了一套可参考的实施框架。 ####
|
1月前
|
人工智能 运维 自然语言处理
智能化运维:AI在IT运维领域的深度应用与实践####
本文探讨了人工智能(AI)技术在IT运维领域的深度融合与实践应用,通过分析AI驱动的自动化监控、故障预测与诊断、容量规划及智能决策支持等关键方面,揭示了AI如何赋能IT运维,提升效率、降低成本并增强系统稳定性。文章旨在为读者提供一个关于AI在现代IT运维中应用的全面视角,展示其实际价值与未来发展趋势。 ####
233 4
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代IT系统中的应用与挑战####
本文探讨了智能化运维(AIOps)在现代IT系统中的关键作用及其面临的主要挑战。随着云计算、大数据和人工智能技术的飞速发展,传统的IT运维模式正逐渐向更加智能、自动化的方向转变。智能化运维通过集成机器学习算法、数据分析工具和自动化流程,显著提升了系统稳定性、故障响应速度和资源利用效率。然而,这一转型过程中也伴随着数据隐私、技术复杂性和人才短缺等问题。本文旨在为读者提供一个关于智能化运维的全面视角,分析其优势与挑战,并探讨未来的发展趋势。 ####
55 6
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术在现代数据中心管理中的实际应用,分析了其带来的效率提升、成本节约及潜在风险。通过具体案例,阐述了智能监控、自动化故障排查、容量规划等关键功能如何助力企业实现高效稳定的IT环境。同时,文章也指出了实施过程中面临的数据隐私、技术整合及人才短缺等挑战,并提出了相应的解决策略。 --- ####
54 1
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在企业IT管理中的应用与实践####
本文深入探讨了智能化运维(AIOps)的核心技术原理,通过对比传统运维模式,揭示了AIOps如何利用大数据、机器学习等先进技术提升故障预测准确性、优化资源分配及自动化处理流程。同时,文章详细阐述了智能化运维平台的实施步骤,包括数据收集与分析、模型训练与部署、以及持续监控与优化,旨在为企业IT部门提供一套切实可行的智能化转型路径。最后,通过几个典型应用案例,如某大型电商平台的智能告警系统和金融企业的自动化故障排查流程,直观展示了智能化运维在实际业务场景中的显著成效,强调了其在提升运维效率、降低运营成本方面的关键作用。 ####
53 4
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术如何革新现代数据中心的运维管理,通过集成人工智能、大数据分析及自动化工具,显著提升系统稳定性、效率和响应速度。文章首先概述了AIOps的核心概念与技术框架,随后详细分析了其在故障预测、异常检测、容量规划及事件响应等方面的应用实例,最后探讨了实施过程中面临的数据质量、技能匹配及安全性等挑战,并提出了相应的应对策略。本研究旨在为数据中心管理者提供关于采纳和优化AIOps实践的洞见,以期推动行业向更高效、智能的运维模式转型。 ####