mPaaS 服务端核心组件:移动同步服务 MSS 架构解析

本文涉及的产品
mPaaS订阅基础套餐,标准版 3个月
简介: 移动同步服务 MSS 是移动开发平台 mPaaS 的核心基础服务组件之一,源自于蚂蚁金服集团内面向移动应用从服务端到客户端进行海量数据推送的全链路解决方案。

mPaaS 服务端核心组件:移动同步服务 MSS 架构解析

承接《mPaaS 服务端核心组件》系列,本篇文章围绕移动同步服务(Mobile Sync Service)展开架构解析。MSS 是移动开发平台 mPaaS 的核心基础服务组件之一,源自于蚂蚁金服集团内面向移动应用从服务端到客户端进行海量数据推送的全链路解决方案。
该系列已推送内容请参考文章尾部推荐。

核心概念解读:移动同步服务 MSS

MSS 的核心概念为:
通过一个安全的数据通道 TCP+SSL,及时、准确、有序地将服务器端的业务数据,主动的同步(SYNC)到客户端 App,可被定义为:一个客户端与服务端之间的可靠消息中间件
image.png

传统的 RPC 已立足互联网行业几十年,也能满足绝大部分业务场景和功能需求。但现阶段随着移动互联网的全面普及和升华,无论是 App 的规模还是用户对于 App 实时响应的要求都已进入了一个新的阶段。
传统的请求响应因 RPC 自身特性,存在许多的不足,典型的如:
1. 客户端 App 在特定的场景下需要调用 RPC 请求来获取最新的数据,而服务端(云端)实际没有或仅有少量数据发生变化;
2. 当客户端启动时,不同的业务模块,业务功能因设计上的独立,需要分别进行 RPC 请求来完成各自业务的数据拉取;
3. 当服务端(云端)有业务数据发生变化时,客户端无法实时感知,或只能定时轮询 RPC 接口来定期检查变化;
4. 从技术角度,传统 RPC 大多基于 http(s) 的短连接进行数据交互,连接上即使使用 keepalive 等特性也无法长期保持连接,无法做到链路持续复用,请求创建连接,证书交换,加解密等对网络耗时及性能都会带来不小的损耗。

由此,为了解决或优化这些问题,MSS 应运而生,其核心特性有:
1. 可靠同步:所谓可靠,是针对业务要求的 QoS(Quality of Service)等级为必达的业务场景而言,SYNC 保证只要用户在该数据有效期内活跃并且匹配业务推送要求的条件(客户端版本号、操作系统类型等多个维度),就一定会让客户端同步到业务推送的数据。
2. 增量有序:MSS 保证同一个通道内到达客户端的消息顺序一定是与业务服务器调用 MSS 服务器的顺序是一致的,并且所有消息以增量方式同步至客户端。
3. 高实时性:当客户端连接的网络状况良好,MSS 推送的实时性是很高的,消息推送耗时几乎是纯网络传输的耗时(1s 之内送达)。当客户端连接的网络受到主干网波动、路由器故障、基站信号弱、客户端存储满等不可抗拒因素干扰时,MSS 推送则会待 TCP 长连接重新建上以后再进行数据同步。

MSS基础原理

类似于 MySQL 的 binlog 机制,MSS 服务器和客户端 SDK 之间传递的基本数据单元为 oplog,当业务需要同步一个变更数据到指定的用户或设备时,业务调用 MSS 接口,MSS 服务端会将业务需要同步的数据变更包装为一个 oplog 持久化到数据库,然后在客户端在线的时候把 oplog 推送给客户端。每个 oplog 拥有一个唯一的 oplog ID,oplog ID 在确定的用户确定的业务范围内保证唯一并且单调递增(按调用顺序)。MSS服务端会按照 oplog ID 从小到大的顺序把每一条 oplog 都推送至客户端。
MSS 服务端和客户端都会记录客户端已经收到的最大 oplog ID,称为同步点(亦可以被理解成数据版本号)。

  1. 典型场景一:长连接建立时,同步积压数据
    假定,客户端有三个业务:Biz1,Biz2,Biz3。它们各自的同步点为:8,17,21。
    MSS 的服务端对这三个业务分别检查同步点之后有没有积压的 oplog。如图所示,服务端检查出来 Biz1 有 ID 为 23,26 的两条 oplog 积压,Biz2 有 ID 为 24,25,29 的三条 oplog 积压,Biz3 有 ID 为 30 的一条 oplog 积压。
    image.png

服务端把上一步中查出来的各个业务积压数据推送给客户端。
image.png

客户端收到数据后,把各个业务最大的 oplog ID 上报给服务端,服务端确认客户端已经收到这些数据。此时 Biz1,Biz2,Biz3,它们各自的同步点为:26,29,30。服务端确认没有积压的数据,同步暂时到达一个稳定的状态。同时,在客户端,MSS SDK 把收到的新数据通知给 Biz1,Biz2,Biz3 三个业务。
image.png

  1. 典型场景二:客户端在线时,实时推送数据
    假定客户端在线,TCP 长连接依旧存活着,Biz3 业务服务器请求把一个数据同步到客户端,MSS 服务器给它的oplog 编号为 35,先持久化至数据库。
    image.png

服务端判断出客户端到服务端的长连接在线,把编号为 35 这条 oplog 推送给客户端。
image.png

客户端收到编号为 35 这条 oplog 后,向服务端 ACK 回执报告已经收到了。此时同步再次暂时到达一个稳定状态。同时,在客户端,SYNC SDK 把收到的新数据通知给 Biz3 业务。
image.png

MSS优势

究其特性和原理,MSS 可体现出独有的优势:
1. 增量推送:增量推送业务数据,可有效减少冗余数据的传输,极大降低网络传输成本。
2. 合并推送:客户端初始化成功时,服务端可一次性推送多个业务数据,避免了不同业务模块各自进行的 RPC 请求。
3. 减少请求:当服务端无增量业务数据时,将不会消耗任何客户端 RPC 请求成本,减少业务的冗余 RPC。
4. 提高时效:当服务端发生数据变化时,可在最短时间内将数据直接推送至客户端,无需等待客户端 RPC 请求时响应。
5. 提升体验:数据在用户无直接感知情况下推送,在渲染客户端界面之前,数据已到位,降低了用户等待时间。

MSS架构

1. 业务&MSS&客户端:
image.png

业务服务仅需与 MSS 服务器端交互,接口成功调用之后,后续数据同步的过程全权由 MSS 来接管,业务系统接入成本非常低。
image.png

MSS 客户端 SDK 与业务模块之间同样有类似的机制来保证数据可靠、唯一,并确保业务模块能被接收到。
2.  MSS 与接入网关:
在之前的文章中曾经提到蚂蚁统一接入网关(Accgw):
image.png

Accgw 承接进行了 TLS 卸载、配置管控、动态 UPSTREAM 路由、MMTP 协议解析、数据包压缩、连接保持、流量管控、以及负载均衡等职责,而 MSS(SYNC)即为 UPSTREAM 路由的其中一个渠道,因此,Accgw 所拥有的超级能力完全被 MSS(SYNC)所应用。
3.  MSS 与 MMTP&HTTP2:
MMTP,全称 Mayi Mobile Transport Protocol,即蚂蚁移动传输协议,是基于 TCP 协议研发的私有协议。该协议将网络数据包划分为两类帧:指令帧和数据帧。
指令帧主要实现网络系统内部的控制,包含为了降低设备功耗而设计的智能心跳、方便链接调度的控制指令帧、客户端网络配置帧等;数据帧则用于传输真正的业务数据。MMTP 拥有极简数据大小、高安全、高扩展以及极致的性能,MSS(SYNC)的数据传输同样也是基于 MMTP;
除此之外,为适应行业标准,MSS 一样在复用 MMTP 数据协议的基础上支持了 HTTP2 链路。

总结

MSS(SYNC)在蚂蚁集团内部已经服务于包括支付宝客户端蚂蚁财富香港版支付宝口碑独立客户端口碑商户客户端等多个超级 App,也应用于蚂蚁国际的印度尼西亚、菲律宾、马来西亚、澳门星汇银行等多个国际站点,支撑的业务范围几乎已涵盖蚂蚁所有版块,从支付、社交、营销、智能客服到财富、信用、保险、再到智能发布、智能运维等。

与此同时,SYNC 也参与了集团内多年双十一、双十二、新春红包大促活动,经过多年的优化和提炼,目前已经具备了亿级在线、百万级 TPS 在线推送能力,在集团内部日推送消息量达到千亿级别的巨大规模,已然成为集团 App 不可或缺的核心基础能力,也是 mPaaS 服务组件的一记重拳。

| 移动开发平台 mPaaS 三款组件重磅上线蚂蚁金服开放平台:

往期阅读

《支付宝客户端架构解析:iOS 容器化框架初探》

《支付宝客户端架构解析:Android 容器化框架初探》

《支付宝客户端架构解析:Android 客户端启动速度优化之「垃圾回收」》

《支付宝客户端架构解析:iOS 客户端启动性能优化初探》

关注我们微信公众号「mPaaS」,获得第一手 mPaaS 技术实践干货

目录
相关文章
|
2月前
|
消息中间件 存储 Java
RocketMQ(一):消息中间件缘起,一览整体架构及核心组件
【10月更文挑战第15天】本文介绍了消息中间件的基本概念和特点,重点解析了RocketMQ的整体架构和核心组件。消息中间件如RocketMQ、RabbitMQ、Kafka等,具备异步通信、持久化、削峰填谷、系统解耦等特点,适用于分布式系统。RocketMQ的架构包括NameServer、Broker、Producer、Consumer等组件,通过这些组件实现消息的生产、存储和消费。文章还提供了Spring Boot快速上手RocketMQ的示例代码,帮助读者快速入门。
|
2月前
|
存储 缓存 算法
分布式锁服务深度解析:以Apache Flink的Checkpointing机制为例
【10月更文挑战第7天】在分布式系统中,多个进程或节点可能需要同时访问和操作共享资源。为了确保数据的一致性和系统的稳定性,我们需要一种机制来协调这些进程或节点的访问,避免并发冲突和竞态条件。分布式锁服务正是为此而生的一种解决方案。它通过在网络环境中实现锁机制,确保同一时间只有一个进程或节点能够访问和操作共享资源。
92 3
|
8天前
|
消息中间件 存储 安全
分布式系统架构3:服务容错
分布式系统因其复杂性,故障几乎是必然的。那么如何让系统在不可避免的故障中依然保持稳定?本文详细介绍了分布式架构中7种核心的服务容错策略,包括故障转移、快速失败、安全失败等,以及它们在实际业务场景中的应用。无论是支付场景的快速失败,还是日志采集的安全失败,每种策略都有自己的适用领域和优缺点。此外,文章还为技术面试提供了解题思路,助你在关键时刻脱颖而出。掌握这些策略,不仅能提升系统健壮性,还能让你的技术栈更上一层楼!快来深入学习,走向架构师之路吧!
42 11
|
1月前
|
监控 前端开发 数据可视化
3D架构图软件 iCraft Editor 正式发布 @icraft/player-react 前端组件, 轻松嵌入3D架构图到您的项目,实现数字孪生
@icraft/player-react 是 iCraft Editor 推出的 React 组件库,旨在简化3D数字孪生场景的前端集成。它支持零配置快速接入、自定义插件、丰富的事件和方法、动画控制及实时数据接入,帮助开发者轻松实现3D场景与React项目的无缝融合。
115 8
3D架构图软件 iCraft Editor 正式发布 @icraft/player-react 前端组件, 轻松嵌入3D架构图到您的项目,实现数字孪生
|
1月前
|
SQL 数据采集 分布式计算
【赵渝强老师】基于大数据组件的平台架构
本文介绍了大数据平台的总体架构及各层的功能。大数据平台架构分为五层:数据源层、数据采集层、大数据平台层、数据仓库层和应用层。其中,大数据平台层为核心,负责数据的存储和计算,支持离线和实时数据处理。数据仓库层则基于大数据平台构建数据模型,应用层则利用这些模型实现具体的应用场景。文中还提供了Lambda和Kappa架构的视频讲解。
185 3
【赵渝强老师】基于大数据组件的平台架构
|
1月前
|
Kubernetes Cloud Native Docker
云原生之旅:从传统架构到容器化服务的演变
随着技术的快速发展,云计算已经从简单的虚拟化服务演进到了更加灵活和高效的云原生时代。本文将带你了解云原生的概念、优势以及如何通过容器化技术实现应用的快速部署和扩展。我们将以一个简单的Python Web应用为例,展示如何利用Docker容器进行打包和部署,进而探索Kubernetes如何管理这些容器,确保服务的高可用性和弹性伸缩。
|
1月前
|
缓存 关系型数据库 MySQL
高并发架构系列:数据库主从同步的 3 种方案
本文详解高并发场景下数据库主从同步的三种解决方案:数据主从同步、数据库半同步复制、数据库中间件同步和缓存记录写key同步,旨在帮助解决数据一致性问题。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
高并发架构系列:数据库主从同步的 3 种方案
|
1月前
|
域名解析 缓存 网络协议
浏览器中输入URL返回页面过程(超级详细)、DNS域名解析服务,TCP三次握手、四次挥手
浏览器中输入URL返回页面过程(超级详细)、DNS域名解析服务,TCP三次握手、四次挥手
|
1月前
|
安全 测试技术 数据安全/隐私保护
原生鸿蒙应用市场开发者服务的技术解析:从集成到应用发布的完整体验
原生鸿蒙应用市场开发者服务的技术解析:从集成到应用发布的完整体验
|
2月前
|
消息中间件 Kafka 数据库
微服务架构中,如何确保服务之间的数据一致性?
微服务架构中,如何确保服务之间的数据一致性?

相关产品

  • 移动开发平台 mPaaS
  • 推荐镜像

    更多