阿里云可观测全面拥抱 OpenTelemetry 社区

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 阿里云作为全球领先的云服务商,始终站在开源观测技术最前沿。深度参与 OTel 社区,坚定支持技术开放生态与全球兼容性技术标准的构建。

作者:古琦

在云计算、微服务、容器化等技术重塑 IT 架构的今天,系统复杂度呈指数级增长。在此背景下,开源可观测性技术已从辅助工具演变为现代 IT 系统的"数字神经系统",为企业提供故障预警、性能优化和成本治理的全方位洞察。作为开源开放的典范,开源可观测打破传统商业方案的封闭性。这不仅大幅降低企业运维成本,更催生出跨厂商的标准化数据模型——以 OTel 协议为核心的观测数据管道,正在成为继 TCP/IP 之后又一基础设施级技术规范。

image.png

阿里云作为全球领先的云服务商,始终站在开源观测技术最前沿。深度参与 OTel 社区,坚定支持技术开放生态与全球兼容性技术标准的构建。


技术深水区:Go 语言应用监控的范式革新


在云原生架构中,Go 语言凭借轻量级协程、高效编译等特性,已成为 Kubernetes、Docker、Etcd 等核心组件的开发语言。但其可观测数据采集却面临独特挑战:传统 Java 采用的字节码插桩方案因 Go 语言的静态编译特性失效,而基于 SDK 的侵入式改造需要开发者手动埋点,导致代码耦合度高、维护成本陡增。


阿里云提出的编译时插桩方案,开创了非侵入式 Go 监控的新范式:在代码编译阶段自动注入观测探针,从而获得与 Java 应用监控一致的可观测能力,如链路追踪、指标统计、持续剖析、动态配置、代码热点、Log & Trace 关联等等。在有效控制性能开销的同时,提供完善、丰富的插件供开发者选择。

image.png

相较于业界主流的 eBPF 以及 SDK 方案,该技术将数据丰富度、扩展性、可靠性大幅提升且避免内核版本兼容性问题。


社区生态:从技术贡献到参与标准建设


成功的开源项目离不开活跃的开发者社区,通过社区成员之间的协作交流,问题得以快速解决,新特性也不断被开发出来。这不仅加速了技术创新的步伐,也为使用者提供了丰富的资源和支持。


加入 OpenTelemetry 社区后,阿里云积极推动技术共享与代码贡献,累计向社区贡献并合并 1000+ PR Reviews、400+ Pull Requests。其中,为了更好支持国内开发者生态,针对国内广泛使用的 XXL-JOB、InfluxDB、MyBatis、Dubbo 等插件,阿里云工程师饶子昊(GitHub ID: steverao)贡献超过 40 项新特性和 Bug 修复并参与 150 余次 PR 评审与问题处理,并主持社区 Java SIG APAC 双周会。基于在 Java SIG 的卓越贡献,饶子昊被任命为 Java SIG 的首位亚太地区 Approver。


除饶子昊之外,阿里云在 OTel 社区开源贡献过程中,培养出 1 位 Maintainer、3 位 Approvers、1 位 Triager 及 8 位 Member。同时,阿里云还与 OpenTelemetry 社区共同探讨和推动 Go 编译时插桩项目发展。


2025 年 1 月,阿里云与全球领先的可观测厂商 DataDog 合作成立的 Go 编译时插桩 SIG,目标是孵化、实现并维护该项目,推动 Go 语言生态下的可观测性发展。正如社区公告所言,整个行业正在向 OpenTelemetry 定义的标准靠拢。最令人兴奋的是,本着开源协作的真正精神,两个行业领导者决定联手并投入 Go 编译时插桩,旨在提供一种统一的、与供应商无关的解决方案并使整个社区以及整个行业受益。

image.png

在技术贡献之外,开源文化鼓励分享与合作,促进了新技术新思想的发展。阿里云在 OTel Community Day、KubeCon 等行业会议中分享技术成果,并设立亚太地区友好的交流时间,促进与全球社区的合作。阿里云通过一系列的技术分享和实际项目贡献,成为亚太地区最积极的贡献企业之一,为 OpenTelemetry 社区建设发挥重要作用。


在云原生时代,技术创新必须与生态共建同频共振。从代码贡献到社区标准建设,中国企业正从技术追随者转变为标准建设者,阿里云将继续全面拥抱 OpenTelemetry,与全球开源社区携手共建高效的观测性生态系统。通过技术创新和贡献,阿里云为企业数字化转型提供坚实的技术支持,助力客户实现业务的持续增长与创新。

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
目录
打赏
0
9
9
4
12675
分享
相关文章
深入可观测底层:OpenTelemetry 链路传递核心原理
本文会系统讲解链路传递一些基本概念,同时结合案例讲解链路传递的过程。
2929 0
深入可观测底层:OpenTelemetry 链路传递核心原理
|
22天前
|
阿里云可观测全面拥抱 OpenTelemetry 社区
阿里云可观测全面拥抱 OpenTelemetry 社区
拥抱 OpenTelemetry:阿里云 Java Agent 演进实践
拥抱 OpenTelemetry:阿里云 Java Agent 演进实践
对话阿里云云原生产品负责人李国强:推进可观测产品与OpenTelemetry开源生态全面融合
阿里云宣布多款可观测产品全面升级,其中,应用实时监控服务 ARMS 在业内率先推进了与 OpenTelemetry 开源生态的全面融合,极大丰富了可观测的数据类型及规模,大幅增强了 ARMS 核心能力。本次阿里云 ARMS 产品全面升级的背景是什么?为什么会产生围绕 OpenTelemetry 进行产品演进的核心策略?在云原生、大模型等新型应用架构类型层出不穷的今天,又将如何为企业解决新的挑战?阿里云云原生应用平台产品负责人李国强接受采访解答了这些疑问,点击本文走进全新升级的阿里云可观测产品。
42095 23
一站式链路追踪:阿里云的端到端解决方案
端到端链路追踪是覆盖全部关联 IT 系统,能够完整记录用户行为在系统间调用路径与状态的最佳实践方案。而真正实现端到端链路追踪,需要解决三个难题:链路插桩、链路采集与加工、链路上下文透传。阿里云 ARMS 目前已支持全链路端到端追踪,快来查看转发吧~
61512 17
面向全栈可观测的分布式链路追踪
全栈可观测App提供了一套完整的分析工具,从数据统计分析能力到数据关联,再到具备智能化和自动化特性的相关工具,以解决人们在可观测性方面所遇到的问题。未来,我们将持续提供更加丰富和强大的分析工具来满足用户的需求。
61400 6
当 OpenTelemetry 遇上阿里云 Prometheus
本文以构建系统可观测(重点为指标监控体系)为切入点,对比 OpenTelemetry 与 Prometheus 的相同与差异,后重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理,最后介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry 及相关落地实践案例,希望能更好的帮助读者更好的理解 OpenTelemetry 及与 Prometheus 的生态融合。
706 0
分布式诊断神器 | 阿里云链路追踪Tracing Analysis正式商用
阿里链路追踪服务 Tracing Analysis 正式商用,提供分布式系统的全链路追踪能力,帮助客户快速发现和定位分布式系统下的各类性能瓶颈,降低了客户自建全链路系统的技术投入和风险,且云上的托管成本仅自建链路追踪系统的1/5甚至更少。
2195 0
分布式诊断神器 | 阿里云链路追踪Tracing Analysis正式商用
一键托管,阿里云全链路追踪服务正式商用:成本仅自建1/5或更少
随着互联网架构的扩张,分布式系统变得日趋复杂,越来越多的组件开始走向分布式化,如微服务、消息收发、分布式数据库、分布式缓存、分布式对象存储、跨域调用,这些组件共同构成了繁杂的分布式网络。
1128 0
一键托管,阿里云全链路追踪服务正式商用:成本仅自建1/5或更少