2022云栖精选—云原生可观测套件ACOS 构建无处不在的可观测基础设施

本文涉及的产品
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
云原生网关 MSE Higress,422元/月
应用实时监控服务-用户体验监控,每月100OCU免费额度
简介: 周小帆阿里云智能资深技术专家

lQLPJxbcF2cqNBvMiM0FeLCMz4ifcSGHeANpqgFLAEAA_1400_136.png

Gartner:可观测性成为数据驱动型决策最强支撑

 

近日,全球权威 IT 研究与顾问咨询公司 Gartner 发布《2023 年十大战略技术趋势》报告。报告围绕优化、扩展和开拓三大主题展开,「应用可观测性」再次成为其中热门趋势之一。

 

Gartner 杰出研究副总裁Frances Karamouzis 表示:为增加盈利,企业IT 高管在持续加快数字化转型的同时,需将目光从节约成本转向新的卓越运维方式。,可观测性以高度统筹与整合的方式将用户数字化操作所产生的可观测数据进行反馈并创造决策循环,提高组织决策有效性。如能在战略中予以规划并执行,可观测性将成为数据驱动型决策的最强支撑

 

但伴随着 IT 技术高速发展,企业在落地可观测过程中必然遭遇三大阻隘。首先,蓬勃发展的开源/商业可观测产品生态与逐渐无法满足云原生 IT 运维需求的传统企业监控体系,造成新老工具、数据与工具的割裂。 如何选择与平衡成为CTOCIO必须面对的选择题。其次,当微服务架构以及分布式架构被越来越多应用于企业业务,以日志为例的典型可观测数据,计算成本与存储成本以指数级增长。在行业形势愈发严峻的当下,可观测成本投入高昂且难以预估,应用场景往往停留在单点排查或基础监控告警上,大张旗鼓的落地可观测基础设施,回报价值未知。以上几点,这都难以说服CTOCIO们投入愈发吃紧的运维预算与人力进行可观测性建设。

 

为解决以上难题,深耕可观测领域的阿里云于今年6月推出阿里云云原生可观测套件ACOS,该产品套件由阿里云 Prometheus 服务、阿里云 Grafana 服务、链路追踪 OpenTelemetry组成,这三款开源流行度最高、生态集成最广的事实标准是云原生可观测套件ACOS核心,旨在通过开放标准打通所有阿里云可观测产品实现全链路数据标准化,并连接企业存量可观测数据资产,与阿里云应用托管平台集成。

 

全面覆盖用户体验(UEM)、应用观测(APM)、云服务观测、成本管理、应急协同效率等场景。帮助企业高效构建开放、高质量、低成本的统一可观测体系。

 

image.png

 

云原生可观测 ACOS 的独特价值

 

相较于其他可观测商业化或开源解决方案,云原生可观测套件在采集、存储、计算、告警、查询、可视化六大环节做到与开源标准的全面兼容与优化提升。同时,将阿里巴巴集团以及阿里云服务海量用户的可观测经验进行产品化输出。这包含超过 50 款阿里云主流云服务的运行指标、大盘和告警规则预置模板。从基础设施到容器,从应用到用户体验,从成本分析到运维效能分析,在接入第一天就做到全链路高质量观测。

 

自发布以来,众多行业客户借助阿里云原生可观测套件 ACOS 快速构建统一可观测体系。以友邦人寿为例,友邦人寿对应用进行容器化、微服务化改造,以适应业务与性能要求。但随着访问链路与部署复杂度提升,观测微服务和 K8s 运行,并构建全栈可观测能力成为巨大挑战。借助 ACOS,友邦人寿将可观测性覆盖研发生产全周期,将研发态与运维态指标关联与展现,从而有效度量研发效率。同时,将多容器集群及应用服务的观测进行统一,将应用性能指标、全局调用链、日志相融进行快速根因定位的同时,形成指挥决策、仪表盘展示、告警推送的多维度观测能力,大幅提升运维服务效率。

 

云原生可观测 ACOS 焕新升级

 

本次云栖大会,阿里云云原生可观测套件 ACOS 三大组件也迎来重要升级。

 

image.png

 

首先,作为容器观测事实标准的阿里云 Prometheus 监控,观测范围从专精容器延伸到全栈可观测。为了帮助更多企业构建统一观测体系,Prometheus 监控已成为阿里云 50+款云产品默认观测基础设施,并与应用实时监控服务 ARMS APM 指标、eBPF 指标、OpenTelemetry 指标联通,以及将企业的 ECS(非 K8s 集群)、K8s 集群、非阿里云集群进行 Prometheus 实例聚合,帮助企业一键开启全球与异构架构下的统一可观测中心。

 

在服务外部客户同时,阿里云 Prometheus 监控不断通过内部场景进行打磨,目前已能够支持千万核的容器观测及数十亿级别时间线的时序存算能力。对于时序监控场景的核心技术难点,如海量动态监控对象采集能力、高基数时间线发散收敛、长周期查询、突发流量下误报漏报等场景进行针对性优化,使得阿里云 Prometheus 监控真正成为无处不在,大规模生产可用的可观测基础设施。

 

在赋予企业强大观测能力的同时,Prometheus 推出全新包年包月计费形式,同等业务规模下,平均相较于自建成本降低 60%。满足不同业务规模用户的观测需求,并尽可能减轻企业的运维成本压力。

 

image.png

 

其次,作为观测界面的阿里云 Grafana 服务也将迎来 9.0 焕新升级。全新的 Prometheus Loki 查询语句生成器及强化后的搜索 Explore 功能,让用户获得更强的数据查询与分析能力,更低门槛的创建可视化大盘与告警。同时,为了应对越来越丰富的异构可观测数据源,Grafana 服务与日志服务 SLSElasticsearch 20+款可观测存储服务集成,帮助企业更简单的构建统一「运维&业务」观测界面。一键导入/导出自建实例、自动数据导出报表,一键数据备份、恢复,用户操作审计等企业特性进一步增强。

 

image.png

 

最后,为了帮助企业的云上应用开启多维度观测视角,应用实时监控服务 ARMS 也迎来巨大升级。在数据采集方面,在完整支持 Opentelemetry SDK 的同时,指标数据可完全通过与 Prometheus 标准进行存储与计算,补充业务、自定义组件埋点。在完善观测维度的同时,避免厂商锁定。并借助 TraceExplorer 实现多来源 Trace 统一查询。

 

与此同时,eBPF 技术以及 Continuous Profiling 作为目前可观测领域最为热门的细分领域,阿里云可观测团队也进行积极探索。本次大会阿里云可观测团队开放基于 eBPF 技术的轻量版应用监控预览,帮助企业快速获得无侵入、全语言的应用监控能力,并及时感知集群全局拓扑结构。

 

同时,与 Alibaba Dragonwell 团队联合推出Continuous Profiling 功能,能够以极低功耗持续分析代码级别的性能开销,覆盖传统链路、指标和日志覆盖不到的细节,实现代码级生产环境性能问题定位及全天候主动剖析,让应用观测视角更丰富,观测颗粒度更细致。

 

image.png

在不断探索更多可观测场景服务阿里巴巴集团以及海量企业用户的同时,阿里云可观测凭借其完备的产品能力与良好的生态集成能力及出色的成本优势,收获了国内外行业机构的高度认可。阿里云应用实时监控服务 ARMS 在今年获得中国信通院首批可观测产品先进级认证。同时,阿里云连续两年进入Gartner APM 与可观测魔力象限,今年更是成为唯一入选的中国厂商。

 

万物皆云的时代,可观测性让云计算更易用高效,最大程度释放业务稳定性、安全性、经济性价值。观测力已成为每个 IT 人的必备核心竞争力。不止于观测,可观测帮助企业分析、洞察并实现高质量的决策与业务创新。而阿里云将不断推动可观测技术演进与落地实践,帮助企业获得最具性价比的可观测性,真正实现高质量数字化转型与创新。

lQLPJxbcF2cqM2TM-M0CnrCgW_7LDpyh1wNpqgFKAPsA_670_248.png

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
25天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
2月前
|
边缘计算 Cloud Native 安全
构建灵活高效的下一代应用架构 随着企业数字化转型的加速,云原生技术正逐渐成为构建现代化应用程序的关键支柱。
随着企业数字化转型加速,云原生技术逐渐成为构建现代化应用的关键。本文探讨了云原生的核心概念(如容器化、微服务、DevOps)、主要应用场景(如金融、电商、IoT)及未来发展趋势(如无服务器计算、边缘计算、多云架构),并分析了面临的挑战,如架构复杂性和安全问题。云原生技术为企业提供了更灵活、高效的应用架构,助力数字化转型。
69 4
|
18天前
|
Kubernetes Cloud Native Ubuntu
庆祝 .NET 9 正式版发布与 Dapr 从 CNCF 毕业:构建高效云原生应用的最佳实践
2024年11月13日,.NET 9 正式版发布,Dapr 从 CNCF 毕业,标志着云原生技术的成熟。本文介绍如何使用 .NET 9 Aspire、Dapr 1.14.4、Kubernetes 1.31.0/Containerd 1.7.14、Ubuntu Server 24.04 LTS 和 Podman 5.3.0-rc3 构建高效、可靠的云原生应用。涵盖环境准备、应用开发、Dapr 集成、容器化和 Kubernetes 部署等内容。
43 5
|
1月前
|
Cloud Native 持续交付 云计算
云原生技术深度探索:构建现代化应用的基石####
【10月更文挑战第21天】 本文将深入探讨云原生技术的核心概念、关键技术及其在现代软件开发中的应用。我们将从容器化、微服务架构、持续集成/持续部署(CI/CD)、无服务器架构等关键方面展开,揭示这些技术如何共同作用,帮助企业实现高效、弹性且易于维护的应用部署与管理。通过实例分析,展现云原生技术在实际项目中的显著优势,为读者提供一套全面理解并应用云原生技术的指南。 ####
34 2
|
21天前
|
监控 Cloud Native 微服务
云端漫步:探索云原生应用的构建与部署
【10月更文挑战第32天】在数字时代的浪潮中,云原生技术如同一艘航船,承载着企业的梦想驶向未知的海洋。本文将带你领略云原生应用的魅力,从基础概念到实战操作,我们将一步步揭开云原生的神秘面纱,体验它如何简化开发、加速部署,并提升系统的可扩展性与可靠性。让我们一起启航,探索云原生的世界!
|
2月前
|
Cloud Native Devops 云计算
云原生技术:构建现代应用的新基石
【10月更文挑战第12天】 本文深入探讨了云原生技术的核心理念、关键技术和实践方法,揭示了其在现代应用开发和运维中的重要地位。通过分析云原生技术的发展趋势和面临的挑战,本文为读者提供了全面而深入的理解,旨在帮助读者更好地利用云原生技术构建高效、灵活和可扩展的现代应用。
37 0
|
14天前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
|
15天前
|
运维 Kubernetes Cloud Native
云原生技术:容器化与微服务架构的完美结合
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术以其灵活性和高效性成为企业的新宠。本文将深入探讨云原生的核心概念,包括容器化技术和微服务架构,以及它们如何共同推动现代应用的发展。我们将通过实际代码示例,展示如何在Kubernetes集群上部署一个简单的微服务,揭示云原生技术的强大能力和未来潜力。
|
17天前
|
消息中间件 存储 Cloud Native
云原生架构下的数据一致性挑战与应对策略####
本文探讨了在云原生环境中,面对微服务架构的广泛应用,数据一致性问题成为系统设计的核心挑战之一。通过分析云原生环境的特点,阐述了数据不一致性的常见场景及其对业务的影响,并深入讨论了解决这些问题的策略,包括采用分布式事务、事件驱动架构、补偿机制以及利用云平台提供的托管服务等。文章旨在为开发者提供一套系统性的解决方案框架,以应对在动态、分布式的云原生应用中保持数据一致性的复杂性。 ####
|
10天前
|
Cloud Native 云计算 Docker
云原生技术的崛起:从容器化到微服务架构
云原生技术的崛起:从容器化到微服务架构