数据变更白屏化利器-推送轨迹上线

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: 微服务引擎MSE面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持Nacos/ZooKeeper/Eureka)、云原生网关(原生支持Ingress/Envoy)、微服务治理(原生支持Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。

背景

Zookeeper 可作为注册配置中心,选主,分布式锁等多种场景,随着业务规模的扩大,业务之间的依赖关系逐渐变得复杂,在这种复杂的场景下如果遇到变更推送相关问题,排查起来相当困难,虽然Zookeeper原有的审计日志能够记录Znode的变更记录,但是无法查询到服务端对变更的推送记录,并且需要人工筛选,费时费力,长时间以来,用户对Zookeeper 更丰富的推送功能的可观测性有了越来越强烈的需求。

image.png

MSE Zookeeper 最新上线推送轨迹能力,提供变更历史,变更推送记录,查询记录回溯能力,助力用户排查配置注册中心推送,变更回溯等难题。

推送轨迹功能介绍

Zookeeper 推送轨迹提供 Znode 变更和查询记录,以及服务端向客户端推送变更事件的记录,根据推送轨迹可以看到客户端的变更是否成功,以及变更成功后,服务端是否将变更事件推送到客户端,推送轨迹能够根据Path和SessionID两个维度查询到对应的日志记录。

Path 查询维度

提供对应的Path 以及事件信息,即可查询对应的Path的变更记录:

image.png

推送轨迹详细展示了Znode变更的记录信息。在推送轨迹页面左侧,展示当前时间段内的Znode变更事件 ,点击左侧变更流水可以定位到右侧的变更及推送事件记录。页面右侧,展示当前时间段内的Znode变更及推送事件,变更事件中显示本次变更的类型,推送事件中展现推送发生事件,推送到的客户端 SessionID。鼠标上移推送详情图标可以查看本地推送的事件类型等详细信息。

Session查询维度

在推送轨迹 Session查询维度页面,展示该Session 相关的推送轨迹 。变更时间表示本次Znode变更所发生的时间,变更时间表示本次Znode变更事件类型,Path表示本次变更的Znode Path,点击详情列信息按钮可以看到详情图标可以看到本次变更事件详细信息,点击详情列跳转按钮可以切换到Path 维度查询的入口查询当前Path在该时间点的推送事件。

image.png

Zookeeper推送轨迹最佳实践

  1. 登录MSE管理控制台
  2. 在顶部菜单栏选择地域。
  3. 在左侧菜单栏选择注册配置中心 > 实例列表。单击目标实例名称或操作列下方的管理
  4. 根据应用场景,对需要排查的 Znode 或者 Client SessionID 进行推送轨迹查询

在微服务场景下,Zookeeper经常被用作注册配置中心,常碰到的一个问题就是,ZooKeeper 在实例变化之后,实例信息更新的实效性问题,当我们需要排查Zookeeper 是否将实例信息的变更或者配置信息的变更推送到客户端以及变更和推送的时间点和变更推送的状态时, 推送轨迹提供了这些信息的回溯能力。例如Dubbo场景中ZooKeeper 作为注册中心,我们需要看到服务实例变更后,从Zookeeper获取的实例信息依然是旧的实例信息,此时我们可以通过一下步骤查找原因:

  • 首先可以在控制台找到对应的服务的Path,

image.png

  • 然后根据Path在推送轨迹中查询对应Znode的变更和查询记录

例如我们需要知道 org.apache.dubbo.demo.DemoService 服务的变更推送记录,在推送轨迹,选择查询维度 路径,并在Path中输入 /dubbo/org.apache.dubbo.demo.DemoService/providers 查询对应的推送记录,根据客户端的SessionID,可以查看对应的变更是否引起服务端推送变更事件,由此确定变更是否成功,变更成功后,对应的客户端是否成功收到服务端的变更事件推送,以及收到推送后是否向服务端进行查询,由此确定客户端是否更新本地的实例信息。

image.png

再例如配置中心场景下,我们常遇到的问题是客户端进行了配置变更,但是其他部分客户端并没有收到变更的推送,我们可以通过一下步骤查找原因:

  • 首先通过变更客户端的SessionId 找到对应的变更记录,点击箭头按钮,跳转到此次变更对应的路径查询维度推送轨迹,确定配置变更是否成功。

image.png

  • 跳转之后我们看到对应的变更记录的推送详情,此时我们可以确定没有收到变更的客户端是否在推送客户端的集合中,如果没有,则说明推送时客户端与服务端连接断开,导致Session 超时被服务端摘掉了,如果事件被成功推送了,接下来查看客户端是否进行新配置的查询,如果没有查询,就需要从客户端进行排查。

image.png

根据以上的排查就可以大致定位问题所在,推送轨迹大大地简化了问题排查的流程。

后续,注册和配置中心还将提供全新的自诊系统,包括事件统计、健康审计等功能,帮助用户更加全面的获取注册和配置中心运行时上更多的业务功能状态数据信息,降低注册和配置中心的问题排查难度、提升可用性。


99大促活动:新客户包年 7 折,包月 8折, 欢迎试用,有问题欢迎扫描钉钉二维码 (34754806)和我们交流~

image.png

相关实践学习
基于MSE实现微服务的全链路灰度
通过本场景的实验操作,您将了解并实现在线业务的微服务全链路灰度能力。
相关文章
|
2月前
|
运维 监控 UED
应用研发平台EMAS常见问题之设备在线状态一直在线突然变成离线状态如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
2月前
|
API 开发工具 Python
钉钉有没有获取群消息内容的接口?怎么提工单(bug反馈或技术答疑)?
钉钉有没有获取群消息内容的接口?怎么提工单(bug反馈或技术答疑)?【1月更文挑战第6天】【1月更文挑战第29篇】
218 1
|
2月前
|
域名解析 运维 监控
应用研发平台EMAS产品常见问题之离线通知收不到如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
2月前
|
设计模式 小程序 安全
【社区每周】商家分账接入指南更新;基础库新增抽象节点功能及上周问题反馈(2月第二期)
【社区每周】商家分账接入指南更新;基础库新增抽象节点功能及上周问题反馈(2月第二期)
160 11
|
Nacos 微服务
问题排查不再愁,Nacos 上线推送轨迹功能
微服务体系下,注册中心的调用和配置变更是家常便饭,例如阿里每天就有百万级变更、亿级推送。可是,一旦出现调用或配置异常,问题排查就成了用户最大的困惑:是注册和配置中心导致的,还是上下游业务自身的问题呢?
4407 0
问题排查不再愁,Nacos 上线推送轨迹功能
|
Dubbo 应用服务中间件 微服务
数据变更白屏化利器-推送轨迹上线
MSE Zookeeper 最新上线推送轨迹能力,提供变更历史,变更推送记录,查询记录回溯能力,助力用户排查配置注册中心推送,变更回溯等难题。
数据变更白屏化利器-推送轨迹上线
|
前端开发 JavaScript 程序员
如何追踪线上错误
如何追踪线上错误
157 0
如何追踪线上错误
|
数据可视化 云计算 计算机视觉
你有一份新功能,待签收:DataV模型查看器,全新上线
当人们拥有了一份“朴华有实”的可视化工具后,就开始在质朴的本质上要求更多,希望自己看到的这个工具变得更鲜活生动,数据不再只是冰冷的汇总展示,希望它更是令人心动又迷人的“小精灵”,简单便捷高效的实现一些视效方面的提升,让其不再抵触陌生,复杂,难懂的一系列各种操作,即享视觉完美体验。
1058 0
你有一份新功能,待签收:DataV模型查看器,全新上线
|
运维 监控 UED
阿里云EMAS远程日志发布新功能(支持移动端设备主动上报日志)
使用阿里云EMAS远程日志最新推出的主动上报日志服务,由移动端提供主动上报接口,通过代码逻辑控制是否主动上报设备日志,问题出现的同时获取设备日志,极大提升特殊场景的日志获取效率,提升问题排查体验和用户满意度。
634 0
阿里云EMAS远程日志发布新功能(支持移动端设备主动上报日志)