数据变更白屏化利器-推送轨迹上线

本文涉及的产品
Serverless 应用引擎 SAE,800核*时 1600GiB*时
云原生网关 MSE Higress,422元/月
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: MSE Zookeeper 最新上线推送轨迹能力,提供变更历史,变更推送记录,查询记录回溯能力,助力用户排查配置注册中心推送,变更回溯等难题。

作者:子葵


背景


Zookeeper 可作为注册配置中心,选主,分布式锁等多种场景,随着业务规模的扩大,业务之间的依赖关系逐渐变得复杂,在这种复杂的场景下如果遇到变更推送相关问题,排查起来相当困难,虽然 Zookeeper 原有的审计日志能够记录 Znode 的变更记录,但是无法查询到服务端对变更的推送记录,并且需要人工筛选,费时费力,长时间以来,用户对 Zookeeper 更丰富的推送功能的可观测性有了越来越强烈的需求。


1.png


MSE Zookeeper 最新上线推送轨迹能力,提供变更历史,变更推送记录,查询记录回溯能力,助力用户排查配置注册中心推送,变更回溯等难题。


推送轨迹功能介绍


Zookeeper 推送轨迹提供 Znode 变更和查询记录,以及服务端向客户端推送变更事件的记录,根据推送轨迹可以看到客户端的变更是否成功,以及变更成功后,服务端是否将变更事件推送到客户端,推送轨迹能够根据 Path 和 SessionID 两个维度查询到对应的日志记录。


Path 查询维度


提供对应的 Path 以及事件信息,即可查询对应的 Path 的变更记录:


2.png


推送轨迹详细展示了 Znode 变更的记录信息。在推送轨迹页面左侧,展示当前时间段内的 Znode 变更事件 ,点击左侧变更流水可以定位到右侧的变更及推送事件记录。页面右侧,展示当前时间段内的 Znode 变更及推送事件,变更事件中显示本次变更的类型,推送事件中展现推送发生事件,推送到的客户端 SessionID。鼠标上移推送详情图标可以查看本地推送的事件类型等详细信息。


Session 查询维度


在推送轨迹 Session 查询维度页面,展示该 Session 相关的推送轨迹变更时间表示本次 Znode 变更所发生的时间,变更事件表示本次 Znode 变更事件类型,Path 表示本次变更的 Znode Path,点击详情列信息按钮可以看到详情图标可以看到本次变更事件详细信息,点击详情列跳转按钮可以切换到 Path 维度查询的入口查询当前 Path 在该时间点的推送事件。


3.png


Zookeeper 推送轨迹最佳实践


1. 登录 MSE 管理控制台


2. 在顶部菜单栏选择地域。


3. 在左侧菜单栏选择注册配置中心 > 实例列表。单击目标实例名称或操作列下方的管理。


4. 根据应用场景,对需要排查的 Znode 或者 Client SessionID 进行推送轨迹查询


在微服务场景下,Zookeeper 经常被用作注册配置中心,常碰到的一个问题就是,ZooKeeper 在实例变化之后,实例信息更新的实效性问题,当我们需要排查 Zookeeper 是否将实例信息的变更或者配置信息的变更推送到客户端以及变更和推送的时间点和变更推送的状态时, 推送轨迹提供了这些信息的回溯能力。例如 Dubbo 场景中 ZooKeeper 作为注册中心,我们需要看到服务实例变更后,从 Zookeeper 获取的实例信息依然是旧的实例信息,此时我们可以通过以下步骤查找原因:


  • 首先可以在控制台找到对应的服务的 Path, 


4.png


  • 然后根据 Path 在推送轨迹中查询对应 Znode 的变更和查询记录 


例如我们需要知道 org.apache.dubbo.demo.DemoService 服务的变更推送记录,在推送轨迹,选择查询维度 路径,并在 Path 中输入 /dubbo/org.apache.dubbo.demo.DemoService/providers 查询对应的推送记录,根据客户端的 SessionID,可以查看对应的变更是否引起服务端推送变更事件,由此确定变更是否成功,变更成功后,对应的客户端是否成功收到服务端的变更事件推送,以及收到推送后是否向服务端进行查询,由此确定客户端是否更新本地的实例信息。


5.png


再例如配置中心场景下,我们常遇到的问题是客户端进行了配置变更,但是其他部分客户端并没有收到变更的推送,我们可以通过以下步骤查找原因:


  • 首先通过变更客户端的 SessionId 找到对应的变更记录,点击箭头按钮,跳转到此次变更对应的路径查询维度推送轨迹,确定配置变更是否成功。 


6.png


  • 跳转之后我们看到对应的变更记录的推送详情,此时我们可以确定没有收到变更的客户端是否在推送客户端的集合中,如果没有,则说明推送时客户端与服务端连接断开,导致 Session 超时被服务端摘掉了,如果事件被成功推送了,接下来查看客户端是否进行新配置的查询,如果没有查询,就需要从客户端进行排查。 


7.png


根据以上的排查就可以大致定位问题所在,推送轨迹大大地简化了问题排查的流程。


后续,注册和配置中心还将提供全新的自诊系统,包括事件统计、健康审计等功能,帮助用户更加全面的获取注册和配置中心运行时上更多的业务功能状态数据信息,降低注册和配置中心的问题排查难度、提升可用性。




99 大促活动:新客户包年 7 折,包月 8 折, 欢迎试用,有问题欢迎扫描钉钉二维码 (34754806)和我们交流~


8.png


相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
5月前
|
运维 监控 UED
应用研发平台EMAS常见问题之设备在线状态一直在线突然变成离线状态如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
5月前
|
运维 监控 开发工具
应用研发平台EMAS常见问题之用阿里的deviceId离线就收不到信息如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
2月前
|
Kubernetes 监控 测试技术
在K8S中,如何实现上线发布流程(灰度发布)?
在K8S中,如何实现上线发布流程(灰度发布)?
|
3月前
|
运维 调度 数据库
快讯~数据推送已上架 DataStudio 数据开发,与工作流完美结合
数据推送日前已在数据服务页面上提供全托管式的推送服务,基于同样的底层推送架构,我们将推送的能力也搬上了数据开发 (DataStudio),结合数据开发已有的工作流,提供了简单推送、合并推送、脚本推送及条件推送等四大推送能力,用户能在既有的工作流上弹性组装四种方式的推送。
76 0
快讯~数据推送已上架 DataStudio 数据开发,与工作流完美结合
|
5月前
|
运维 监控 Android开发
应用研发平台EMAS常见问题之安卓push的离线转通知目前无法收到如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
5月前
|
运维 监控 Java
应用研发平台EMAS常见问题之不设置SendChannels无法收到推送如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
5月前
|
域名解析 运维 监控
应用研发平台EMAS产品常见问题之离线通知收不到如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
Nacos 微服务
问题排查不再愁,Nacos 上线推送轨迹功能
微服务体系下,注册中心的调用和配置变更是家常便饭,例如阿里每天就有百万级变更、亿级推送。可是,一旦出现调用或配置异常,问题排查就成了用户最大的困惑:是注册和配置中心导致的,还是上下游业务自身的问题呢?
4543 0
问题排查不再愁,Nacos 上线推送轨迹功能
|
Dubbo Cloud Native Java
数据变更白屏化利器-推送轨迹上线
微服务引擎MSE面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持Nacos/ZooKeeper/Eureka)、云原生网关(原生支持Ingress/Envoy)、微服务治理(原生支持Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。
数据变更白屏化利器-推送轨迹上线
|
前端开发 JavaScript 程序员
如何追踪线上错误
如何追踪线上错误
170 0
如何追踪线上错误
下一篇
无影云桌面