深度剖析 RocketMQ 5.0,流存储:流场景的诉求是什么?

简介: 本文将从使用的角度出发,来更详细的展示一下流存储的场景,看看它和业务消息的场景有哪些区别。 RocketMQ 5.0 面向流存储的场景,提供了哪些特性。再结合两个数据集成的案例,来帮助大家了解流存储的用法。

1.前言


从初代开源消息队列崛起,到 PC 互联网、移动互联网爆发式发展,再到如今 IoT、云计算、云原生引领了新的技术趋势,消息中间件的发展已经走过了 30 多个年头。

目前,消息中间件在国内许多行业的关键应用中扮演着至关重要的角色。随着数字化转型的深入,客户在使用消息技术的过程中往往同时涉及交叉场景,比如同时进行物联网消息、微服务消息的处理,同时进行应用集成、数据集成、实时分析等,企业需要为此维护多套消息系统,付出更多的资源成本和学习成本。

在这样的背景下,2022 年,RocketMQ 5.0 正式发布,相对于 RocketMQ 4.0,架构走向云原生化,并且覆盖了更多的业务场景。想要掌握最新版本 RocketMQ 的应用,就需要进行更加体系化的深入了解。

基于此,阿里云消息产品线负责人,Apache RocketMQ PMC Member 林清山老师(花名:隆基),将为你深入剖析 RocketMQ 5.0 的核心原理,分享不同场景下的最佳实践。


2.背景


今天我们要学习的是 RocketMQ 5.0 的流存储。什么是流存储呢?前面我们在 RocketMQ 5.0 的概述里提到 RocketMQ 5.0 具备“消息、事件、流”一体能力。这里的流指的就是流处理,而流存储是流处理的基石,流存储也是 RocketMQ 从应用架构集成走向数据架构集成的基础,为大数据架构的数据组件提供异步解耦的能力。


第一部分,我们将从使用的角度出发,来更详细的展示一下流存储的场景,看看它和业务消息的场景有哪些区别。第二部分我们会讲 RocketMQ 5.0 面向流存储的场景,提供了哪些特性。第三部分,我们再结合两个数据集成的案例,来帮助大家了解流存储的用法。


3. 什么是流场景


我们先看第一部分,什么是流场景。我们通过这个对比图来看,消息和流的区别。前面我们讲的消息基础、消息进阶都侧重于讲消息的业务集成。这里 RocketMQ 的主要作用是连接业务应用,解耦业务架构的上下游系统,比如交易系统的解耦。这类场景,更多的是在线业务,由用户触发某个业务流程,比如购买。为了保障用户体验,消息系统要优先保障低延迟。这个场景里和同步通信 RPC 对应,消息系统承担都是异步通信职责。在消息消费层面,更多的是基于消息数据执行对应的业务逻辑,触发下一个业务流程。每条消息的处理都是不相关的,无状态的。侧重于业务数字化场景,可类比于数据库的 OLTP,单次操作数据量少,用于在线交易。


再来看流场景的话,它主要是侧重于数据集成,连接各种数据组件,进行数据分发,解耦数据架构的上下游系统。比如日志解决方案,采集日志数据,进行 ETL 将日志数据分发到搜索引擎、流计算、数据仓库等。除了日志之外,数据库 Binlog 分发、页面点击流也是常见的数据源。在这种场景里里面,由于是离线业务,它对低延迟的需求较弱,更加侧重于大批量吞吐型负载。另外在消息消费阶段,不再是单条消息处理,更多的是批量转储,或者批量进行流计算。侧重于数字业务化场景,可类比于数据库的 OLAP,单次操作数据量大,用于离线分析场景。


image.png


4. 流存储特性


4.1. 流存储基础


第二个章节我们学习在流的场景下,对于 RocketMQ 的用法有何不同。最大的区别就是它对于消息数据的访问模式。


  • 由于用在数据集成场景,对于大规模的数据集成,不可避免的要涉及到数据的分片,基于数据分片来连接上下游数据系统。为了提升数据集成的质量,需要 Topic 的分区数不变,这样才能保证同一个分区的数据不会错乱。在消息的读写方式上,不再是指定 Topic 读写,而是指定 Topic 分片,也就是队列,进行读写操作。
  • 作为流存储系统,下游的消费通常会是一些流计算引擎,用于有状态计算。为了支撑流计算引擎的容错处理,它需要支持 checkpoint 机制,类似于为流计算引擎提供 redolog,能够按照队列位点重放消息,重新恢复流计算的状态。它也会要求分片内有序,同一个 key 的数据会 hash 到同一个分片,用于实现 keyby 的操作。


image.png


这个就是流存储访问模式跟消息访问模式的区别。在消息场景里,用户只需要关注到 topic 资源,无需了解队列、位点等概念。


4.2. 流存储弹性


4.2.1. RocketMQ 经典扩容模式


刚才我们从用户维度了解了流存储的使用方式。现在我们再从运维角度来看流存储如何弹性。我们现在回顾一下现在业界的弹性方式。左下图是 RocketMQ 的经典扩容模式,比如说要将 topic a 的容量扩容一倍,一般做法是新增一台机器,然后创建 topic a,新增同等数量的队列。这样的话,分片数量也会扩容一倍,无法满足流存储固定分区的场景。


右下图则是 Kafka 的扩容模式,要将 topic a 的容量扩容一倍时,需要添加一个新节点,并将原来旧节点的分区 mq-2 迁移到新节点。它虽然可以保证数分区数量不变,但是要对分区数据做迁移。当分区数特别多且数据量大,讲对集群产生流量风暴,严重影响稳定性,而且整个扩容时间不可控。这就是现有的流存储弹性机制的不足。


image.png


4.2.2. RocketMQ 5.0 静态 Topic 扩容模式


为了解决经典流存储的扩容难题,RocketMQ 5.0 提供了一种新的模式,引入静态 topic 。在静态 topic 的扩容模式,可以做到分区数不变,且扩容过程无数据迁移,可以实现秒级的扩容。


它的实现关键点是引入逻辑队列的概念。就是对于用户来说,它的访问的对象是不再是原来绑定到某个 Broker 的物理队列,而是 Topic 全局的逻辑队列,每个逻辑队列会对应一个或者多个物理队列。我们基于实际的案例,来理解逻辑队列的实现原来,图为 topic a 进行流量扩容一倍的操作,最初逻辑队列1绑定的物理队列是 broker1 的 mq1。在扩容完成后,broker1-mq1 变成只读状态,逻辑队列1的最新读写操作都在 broker2-mq1。生产者最新的消息都会发往 broker2-mq1。消费者如果读最新数据,则直接从 broke2-mq1 的物理队列里面去读取。如果它读的是老数据的话,读请求讲转发到旧物理队列 broker1-mq1。这样就完成了整个静态 topic 的扩容流程。既保证的分区数不变,又实现了没有数据迁移,降低了大量的数据复制,提升了系统的稳定性。


image.png


4.3. 高吞吐


在流场景里面,还有一个很重要的变化,就是数据类型的变化。


做个简单对比,业务集成场景,消息的数据承载的是业务事件,比如说订单操作、物流操作,特点就是数据规模较小,但是每一条数据的价值都特别高,访问模式是偏向于在线的,单条事务的短平快访问模式。


而在流的场景里面,更多的是一些非交易型的数据。比如说用户日志,系统的监控、IoT 的一些传感器数据、网站的点击流等等。特点是数据规模有数量级的提升,但单条数据的价值比较低的,访问模式偏向于离线批量传输。所以在流的场景里面,RocketMQ 存储要面向高吞吐做更多的优化。


image.png


在 RocketMQ 5.0里面,我们引入了端到端的批量消息。如何理解端到端呢?就是从客户端开始,在发送阶段,消息在客户端攒批到一定数量,直接一个 RPC 请求里面直接发到 broker 端。broker 存储阶段,直接把整批消息存储,用批量索引的技术,一批消息只会构建一个索引,大幅度提升索引构建速度。在消费阶段,也是按照整批数据读取到消费端,先进行解包操作,最后执行消费逻辑。这样整个 Broker 的消息 TPS 可以从原来的十万级提升至百万级。


image.png


4.4. 流的状态


流存储通常会对接流计算引擎,比如 Flink、Spark 等。流计算引擎涉及的一些有状态计算,如数据聚合类的,求平均、求总和、keyby、时间窗口等算子都需要维护计算状态。


所以在 RocketMQ 5.0 里面,我们新增了 CompactTopic 的类型,是一种以流为核心的类 KV 服务,在不引入外部 KV 系统的情况下维护流的状态。它还适用于一些特殊场景,可作为最新值队列,比如用于股票价格流场景,股票交易,用户只关注每只股票的最新价格。


我们通过下图来了解一下 CompactTopic 的实现,在 CompactTopic 里面,每条消息就是一对 KV。如果用常规的Topic,那么同一个 Key 的持续更新会占用大量的空间,影响读的效率。在生命周期管理上,也会因为磁盘占用过高,按照 FIFO 的方式,旧数据被整批删除。而对于 CompactTopic 来说,Broker 会定期对同一个 Key 的消息进行合并,节约存储空间,用户对 Topic 的流式访问,也只会读到每个 Key 的最新值。


image.png


我们来结合这个例子,能对 CompactTopic 有更加形象的理解。消息生产没啥区别,需要为消息添加 Key。区别主要体现在消费的方式上,首先我们要用 PullConsumer,这是一个用于流场景的的消费者 SDK。然后我们要获取 Compact topic 的队列,进行队列分片。然后每一个消费者实例都会分配到固定的队列,承载这个分区的流状态的恢复。在这里的话,用 HashMap 进行模拟,重放整个队列,重新构建 KV。


image.png


4.5. 流数据 Schema

随着 RocketMQ 的数据生态的繁荣,数据集成涉及的上下游组件越来越多,提升数据治理能力也变得迫在眉睫。因此我们在 RocketMQ 5.0 引入 schema 的概念,为消息增加结构化的描述。它带来了几个好处:第一个是可以提高类型的安全,避免消息结构变化导致上下游数据集成不兼容,集成失败。第二个是可以提升数据集成的研发效率,上下游通过 schema 注册中心获取消息结构,节约沟通成本,内置高效序列化机制,无需编写重复的序列化代码。同时在流表融合的大背景下面,消息 schema 能和数据库的表结构的概念完成映射,提升流式 SQL 亲和度。


下图是就是消息 schema 的架构。首先会有一个 schema 注册中心的组件,维护 schema 的数据,数据存储基于CompactTopic。在消息收发的过程中,客户端都会先去获取 schema 的格式,进行格式的校验,用内置的序列工具进行序列化,从而完成整个消息收发的链路。


image.png


我们再来看 schema 的代码示例。左边是生产者、右边是消费者,代码结构和常规的方式接近。唯一的区别是,发送的对象是业务领域对象,无需自行转成 byte 数组。对于消费者也一样,消费者直接获取业务对象执行业务逻辑,减少了序列化、反序列化等繁杂的工作,提高了研发的效率。


image.png


5. 典型案例


最后我们再来看几个 RocketMQ 流存储的例子。


  • 第一个案例是日志的采集和流 SQL 分析,首先我们通过批量的索引,提升日志采集的吞吐量,降低机器成本。我们为日志消息引入 schema,如这是用户在电商平台的行为操作,如商品进行收藏、加购、购买等操作,使得消息数据就像流动的表。在流存储下游对接 FlinkSQL 或者 RSQLDB,完成流式 SQL 分析。


image.png


  • 第二个案例是异构数据库的同步。如下图,我们有两个数据库,一个是按照买家 ID 的维度进行分库分表的。另外一个是按照卖家 ID 的维度进行分库分表,我们需要实时同步两个数据库的订单状态。基于 RocketMQ 的的流存储的能力,上游按照订单的 ID 去对 Binlog 进行分片,确保同一个记录的 binlog 数据能分发到同一个队列。在消费阶段按照顺序重放队列里的 binlog 数据,把数据同步到卖家库。当流量不足时, RocketMQ 对静态 Topic 进行扩容,分区数不变,保障了数据同步的正确性。


image.png


6. 本章小结


这节课我们了解的流存储用于数据集成的场景,它可以作为大数据架构的数据枢纽,连接数据的上下游组件。而 RocketMQ 的流存储的特性,既包含功能层面,提供流式的访问接口、状态存储、数据治理的能力,也包括了流的弹性、流的高吞吐能力。最后,我们也展示了两个数据集成的案例,包括日志的分析以及异构数据库的同步。


下节课我们将在流处理的方向做进一步的延伸,一起学习 RocketMQ 5.0 的流数据库。


点击此处,进入官网了解更多详情~


《深度剖析 RocketMQ 5.0》系列课程分为两个模块:

第一模块,核心探究。回顾 RocketMQ 的诞生背景和发展历程,带你了解 RocketMQ 5.0 诞生背后云原生、IoT、实时数据等等的场景诉求,从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构,掌握消息服务背后的核心原理。

1.《深度剖析 RocketMQ 5.0|Apache RocketMQ:如何从互联网时代演进到云时代?》

2.《深度剖析 RocketMQ 5.0|架构解析:云原生架构如何支撑多元化场景?》

3.《深度剖析 RocketMQ 5.0|消息基础:RocketMQ 在业务消息场景的基础优势是什么?》

第二模块,场景拆分。从业务场景切入,详细介绍 RocketMQ5.0 在不同的业务场景提供的能力和关键技术原理,包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

4.《深度剖析 RocketMQ 5.0|消息进阶:如何支撑复杂业务消息场景?》

5.《深度剖析 RocketMQ 5.0|流存储:流场景的诉求是什么?》

6.《深度剖析 RocketMQ 5.0|流数据库:如何实现一体化流处理?》

7.《深度剖析 RocketMQ 5.0|IoT 消息:物联网需要什么样的消息技术?》

8.《深度剖析 RocketMQ 5.0|事件驱动:云时代的事件驱动有啥不同?》

本系列课程将帮助你构建对 RocketMQ 5.0 的全新认知,对当前时代背景下的消息诉求有更深刻的理解。

作者

林清山(花名:隆基,阿里云消息负责人,Apache RocketMQ PMC Member)

作者介绍
目录

相关产品

  • 云消息队列 MQ