云原生可观测
云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。
云监控2.0重磅升级!ECS系统问题深度诊断实战揭秘 —— 阿里云SysOM系统诊断能力全解析
在云原生与大规模分布式系统时代,ECS操作系统层的问题往往“看不见、摸不着、难定位”——内存莫名被吃光?IO延迟飙升却找不到源头?Redis超时竟源于cgroup泄漏?传统监控工具束手无策! 本次直播,我们将首次深度解读 阿里云云监控2.0 ECS洞察中的SysOM系统诊断能力,基于阿里多年双11实战经验打造的一体化OS运维平台,真正实现从“被动救火”到“主动洞察”的转变! 讲师/嘉宾简介 诗雁|阿里云操作系统团队技术专家
从集成到稳定:UModel API 集成与运维自愈机制详解
深入解析 UModel 的 PaaS API 设计理念与集成实践路径;同时系统梳理高频使用问题与典型报错场景,提升用户独立运维与快速恢复能力。从“如何接”到“出了问题怎么查”,帮助开发者和运维团队构建更可靠、可持续的 UModel 应用体系。 讲师/嘉宾简介 张鑫(千乘)|技术专家
从定位到关联:构建 UModel 数据发现与链路分析的全链路能力
聚焦 UModel 核心查询能力,系统讲解通过元数据查询与实体检索快速定位字段来源、模型定义与业务上下文;借助图查询能力可视化展现模型间依赖关系,揭示调用链路与影响范围。两大能力层层递进,全面提升建模系统的可追溯性与治理效率。 讲师/嘉宾简介 任建(路遥)|高级工程师、隰宗正(霜键)|高级工程师
使用应用监控 eBPF 版实现无侵入的应用可观测
直播讲师:张海彬直播简介:eBPF 技术是一种在 Linux 内核中运行沙盒程序,具有无侵入、语言无关、全栈监控等能力,无需修改任何代码,即可实现应用的可观测能力,本次主要讲解 ARMS 通过 eBPF 技术实现无侵入的应用可观测。
掌握ARMS持续剖析-轻松洞察应用性能瓶颈
1.介绍可观测领域近年来新出现的强有力根因定位技术持续剖析。2.介绍ARMS所提供的开箱即用持续剖析功能,如何轻松帮助定位应用CPU、内存、慢调用链相关代码级问题根因。讲师/嘉宾简介饶子昊
《十万个可观测冷知识》—如何分析多个业务请求失败导致的用户业务操作失败
随着互联网成为生活必须品,用户在使用产品时经常需要填写表单或其他信息,其中是否能够成功提交成为非常关键的环节,那如何分析多个业务请求失败导致的用户业务操作失败呢?点击本视频,立即查看本期可观测的十万个冷知识~
可观测技术沙龙《More than Tracing Logging Metrics》
可观测技术沙龙(主会程)主题:《More than Tracing Logging Metrics》演讲人:吴晟Skywalking 创始人 & Apache基金会创世成员
可观测技术沙龙《Observability with Prometheus and beyond》
可观测技术沙龙(开源探索)主题:《Observability with Prometheus and beyond》演讲人:Richard HartmannGrafana Labs 亚太区首席解决方案工程师Éamon Ryan, Grafana Labs 首席现场工程师
可观测技术沙龙《行业SaaS的微服务稳定性保障实战 》
可观测技术沙龙(行业实践)主题:《行业SaaS的微服务稳定性保障实战》演讲人:祁晓波 南京爱福路汽车科技有限公司基础设施团队负责人
如何利用性能优化驱动用户体验提升
如果要票选五大最抓狂运维支撑场景,花样繁多的各种促销活动一定榜上有名。由于用户体验与网站性能造成的用户转化低、业务增长缓慢等糟糕结果,最终都会让运维工程师成为“众望所归”的背锅侠。那么,运维工程师如何拒绝成为背锅侠?本次直播为大家分享如何利用性能优化驱动用户体验提升,让您的产品实现健康增长。
微服务应用可观测性增强方案探索与实践
彼得·德鲁克:“如果你无法量化它,你就无法管理它。”如果说监控告诉我们系统出问题了,那么可观测就告诉我们系统哪里出问题以及导致原因。当我们从微服务视角开始思考应用可观测性时,基于传统方案之上还能再增强哪些事情?本次分享将会提供一种新的微服务可观测思路,让我们轻松透视Dubbo应用内部问题。讲师/嘉宾简介十眠
阿里云云原生全栈可观测实践—故障洞察提效 50%
直播介绍:(建议600字以内) 1、阿里可观测技术是如何从淘宝电商时代的APM发展演进到当下全栈观测的? 2、如何做好无侵入的数据采集技术? 3、如何通过智能告警来提醒告警配置效率? 4、观测数据存储&计算成本控制的有效策略有哪些? 5、全栈可观测实践案例分享。 讲师/嘉宾简介 曾国庆(悦达)|阿里云智能·技术专家,KubeVela 社区 Maintainer
RocketMQ直播课:5.0新版本可观测能力详解
● 可观测能力升级:Tracing链路追踪介绍RocketMQ的可观测能力,主要涉及Tracing的背景、设计和最佳实践。● 可观测能力升级:Metrics 指标分析介绍RocketMQ的可观测能力,主要涉及Metrics实现、指标定义、上报方式和最佳实践等。讲师文婷阿里云消息队列产品专家张森泽(玄珏)阿里云消息技术专家
应用实时监控服务ARMS-持续性能分析实践解析
应用性能剖析是一种分析程序的时间和资源占用的方法。更好的应用性能,可以提供更好的用户体验,可以降低企业IT成本,可以让系统更稳定和可靠。本期内容将介绍如何利用ARMS Continuous Profiler去定位和修复应用性能问题。 讲师/嘉宾简介 杨龙 (阿里云程序语言与编译器部JVM工具开发专家)
阿里云 x Elastic 联合Meetup “Elasticsearch 在可观测性软件架构服务中的应用实践”
阿里云 x Elastic 联合Meetup 北京站“Elasticsearch 在可观测性软件架构服务中的应用实践”马小鹏 阿里云高级技术专家
云上可观测能力:问题的发现与定位实践 | 云上自动化运维CloudOps系列沙龙_第一弹
可观测,才可靠:云上自动化运维CloudOps系列沙龙 讲师/嘉宾简介: 杨泽强:阿里云弹性计算SRE技术专家 郝晨栋:阿里云弹性计算技术专家 秦 隆:阿里云弹性计算专家 邓青琳:阿里云弹性计算专家
使用Kubernetes监控发现资源使用,流量分布不均匀的问题
为了支持日益增长的用户请求流量,大规模系统架构追求服务实例无状态可水平扩展的特性。这就要求流量均匀分配到各服务实例,容器和节点的资源使用也尽可能平均,否则热点问题将严重拖累系统性能,导致严重故障。因此,如何从流量及资源两个维度的监控数据,快速发现热点问题,提前消除隐患,成为kubernetes监控的重点。
ALL in one:如何搭建端到端可观测体系
本场直播将为您介绍如何通过Prometheus+Grafana构建企业一体化的应用可观测体系,包含阿里云ARMS,Prometheus和Grafana服务的最佳使用实践及产品介绍。
观测云实践学堂04期《Top 10! 观测云年度最佳可观测性产品功能》
1.场景笔记(更好地记录与分享,助您高效排障) 2.场景自定义查看器(敏捷搭建,快速定位问题所在) 3.时序图相似性指标查询(高效对比排查性能故障) 4.SLO监控(全面衡量系统稳定性,提高使用体验) 5.未恢复事件查看器(实时查看分析监控告警记录) 6.主机网络分析(实时了解业务系统网络运行状态) 7.日志黑名单过滤(优化存储数据信息,节约成本) 8.构建内网服务可用性监测(支持自建拨测节点,保障服务可用性) 9.安全巡检(保证主机所有行为安全可控) 10.DCA桌面客户端(便捷管理您已安装的采集器) 讲师/嘉宾简介 储文姬 观测云产品运营