云原生可观测性的现状、搭建方法和发展趋势

本文涉及的产品
应用实时监控服务-用户体验监控,每月100OCU免费额度
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 云原生可观测性的现状、搭建方法和发展趋势

当下 BAT、美团、字节跳动等一线大厂都在加速推进业务的容器化、云原生化。打开这篇文章的你,应该或多或少跟云计算、容器、Kubernetes、云原生应用有过接触。

在这样的背景之下,很多问题成了开发、测试、运维同学的家常便饭:

  • 某个新版本发布上线之后,发现主机的 CPU 使用率持续飙高,但不知道根本原因在哪,只能根据过往的经验一一排查;
  • 新版本上线之后,很难判断功能是不是完全正常,只能等着用户找客服投诉之后,才知道哪个模块出现了报错;
  • 基础设施方面,通过监控搞了一大堆稀奇古怪的仪表盘,看着花花绿绿一大片,可是又不能反映出业务的真实情况,也不能跟随业务的变化而灵活调整。

局面混乱,效率又不高。可以说,监控,被架到了一个不得不自己命的位置。而可观测性(Observability)就是解决这些问题的关键。

甚至,Gartner 在 2022 年度的基础设施和运维自动化技术成熟度周期图里,把“可观测性”放在膨胀期波峰最顶端位置,可以说是风头正盛。

可观测性适用于任何关心代码在生产环境中的运行质量的人。它可以监测和解决生产系统中复杂而新颖的问题。具体到岗位上:可观测性能够架起开发人员和运维人员构建合作的桥梁:运维人员使用它来发现问题,给故障现场提供足够的数据让开发人员进行分析,而开发人员可以使用它来指导运维人员定位问题,并使用工具来质疑和验证假设。此外,测试、DevOps 工程师、SRE 工程师等角色都可以了解和学习可观测性,以此提高产品质量和服务可靠性。

如何学习可观测性?

虽说,可观测性是云原生一个绕不开的话题,但是可观测性到底指的是什么?效果又是否真的能达到预期?到底是自建可观测性平台还是直接购买比较好?如何搭建可观测平台?……网上关于上面的疑惑的解答很多,但资料非常驳杂没有真正成体系化的知识。繁杂的数据中快速提炼有用的数据,高效解决可观测性的问题,是非常难的。在这里给大家推荐观测云的产品技术总监翁一磊总结的「可观测性学习路径」上图内容来自,他在极客时间开设的新专栏《深入浅出可观测性》



为什么说翁一磊能讲好可观测性?

翁一磊,观测云的产品技术总监,主要负责售前技术和客户服务工作。他曾经就职于微软、HP、Dell EMC 等外企,从最初的技术支持,到售前以及项目交付,再到解决方案集成与验证,相关的工作可以说是做了一圈。从外企出来之后,他负责过多云管理产品计算机软件领域的可观测性,在国外是在 2018 年左右提出的,现在已经有了不少玩家,比如久负盛名的 DataDog;而国内是在今年,可观测性才成为热门话题的。

近几年的观察让他意识到,很多时候人们只是把原来传统的监控换了一个壳子,变成了可观测性。正所谓新瓶装旧酒,但其实这并不是真正意义上的可观测性。而为了矫正这种观点,看清可观测性的本质和价值,他结合自己在这一领域多年的经验和思考,带你直抵可观测性的内核,合理、高效地部署可观测平台。

这门专栏是如何设计的?

在这个可观测性的课程中,他会从下面几个方面为你展开讲解:

概念篇:为了更好地理解可观测性,首先带你理一理监控的发展历程。接着,他会详细解读可观测性相关的基本概念,包括你可能经常听到的可观测性三支柱。之后带你一起辨析可观测性和传统监控的区别。

基础篇:他会首先介绍一下 OpenTelemetry ,这是目前可观测领域非常成熟和热门的标准和规范,在此基础上,带你进一步了解如何实现和建立非某个供应商锁定的可观测性。接下来,还会给你分析购买或自己搭建可观测性的利弊,拥有全局观念,在有需求的时候理智下判断。实战篇:这部分是专栏的重头戏,毕竟可观测性最重要的目标,就是保障系统和应用的服务可靠性。这个模块,会讲到队协作,可观测驱动的开发,建立、跟踪SLO等话题,然后他会选取微服务架构的系统,带你搭建起这个系统的可观测性,让你在动手操练的过程中更好地掌握可观测性,并能够通过可观测性来分析和解决问题。总结与展望篇:讲述如何构建可观测性的文化和框架,让你了解在企业中推广可观测性需要优先考虑的关键能力。还会给你介绍可观测性未来的发展趋势。 接下来,我们通过目录来看看具体内容吧:

相关文章
|
3月前
|
运维 Cloud Native 安全
云原生技术的未来趋势是什么?
【8月更文挑战第27天】云原生技术的未来趋势是什么?
145 4
|
3月前
|
Cloud Native 安全 数据安全/隐私保护
云原生技术在现代企业中的实践与挑战
【8月更文挑战第29天】 随着数字化转型的深入,云原生技术成为企业IT架构升级的关键。本文将探讨云原生的核心价值、应用实例及其面临的挑战,旨在为读者提供一份云原生实践的指南和思考。
45 4
|
3月前
|
运维 Cloud Native 安全
云原生技术的未来展望:探索与实践
【8月更文挑战第10天】 在数字化浪潮的席卷下,云原生技术以其灵活性、可扩展性和高效率成为推动现代软件开发和运维革新的关键力量。本文将深入探讨云原生技术的现状,分析其面临的挑战,并展望未来的发展趋势,为读者提供一个关于如何利用云原生技术来构建和优化应用的全面视角。
77 13
|
3月前
|
运维 Cloud Native 云计算
探索云原生架构的未来趋势与挑战
【8月更文挑战第17天】随着云计算技术的不断发展和成熟,云原生架构已经成为现代软件开发的重要趋势。本文将深入探讨云原生架构的核心概念、优势以及面临的未来挑战和发展趋势,旨在为读者提供一个全面了解云原生架构的窗口,同时展望其对未来软件开发模式的影响。
|
3月前
|
Kubernetes Cloud Native 安全
云端创新:云原生技术的未来展望
随着数字化转型的深入,云原生技术正成为企业IT战略的核心。本文将探讨云原生技术如何推动业务创新,以及未来可能的发展趋势和挑战。
|
3月前
|
人工智能 边缘计算 Cloud Native
云原生架构的未来趋势与挑战
【8月更文挑战第13天】随着云计算技术的不断成熟和演进,云原生架构已经成为企业数字化转型的重要推动力。本文将深入探讨云原生技术的最新进展、面临的主要挑战以及未来可能的发展方向,旨在为读者提供一个全面而深入的云原生技术洞察。
|
5月前
|
Kubernetes Cloud Native 持续交付
云原生技术的演变与未来趋势
在数字化转型的浪潮中,云原生技术成为推动现代软件开发、部署和运营的关键力量。本文将深入探讨云原生技术从诞生到成熟的过程,分析其在当前企业中的应用现状,并预测未来的发展趋势。通过引用最新的行业报告和科学研究,文章旨在为读者提供对云原生技术演进的深刻见解,并揭示其对企业IT架构的长远影响。
|
5月前
|
人工智能 运维 Cloud Native
云端融合:探索云原生技术的未来趋势
【6月更文挑战第19天】 在数字化时代的浪潮中,云原生技术如同一颗耀眼的星辰,引领着软件开发和运维的新方向。本文将深入探讨云原生技术的核心概念、优势以及面临的挑战,并通过案例分析展现其在实际应用中的成效。我们将一窥云原生技术如何推动企业IT架构的现代化转型,以及它在未来可能带来的行业变革。
|
4月前
|
监控 Cloud Native 安全
云原生架构在现代企业中的实践与挑战
本文深入探讨了云原生架构在现代企业中的应用及其面临的主要挑战。通过分析多个行业案例,文章揭示了云原生技术如何促进企业的数字化转型,提高系统的弹性、可扩展性和自动化水平。同时,指出了在实施过程中可能遇到的技术、安全和成本管理等问题,并提供了相应的解决策略,旨在为企业采用云原生架构提供实用的指导和建议。
|
4月前
|
运维 Cloud Native Devops
云原生技术演进与未来趋势
随着企业数字化转型的加速,云原生技术作为推动现代软件开发和运维模式的核心力量,其发展态势受到业界广泛关注。本文将深入探讨云原生技术的演进路径,分析其在容器化、微服务架构及自动化运维等方面的创新实践,并预测未来的发展趋势。通过引用最新的研究报告和统计数据,本文旨在为读者提供一个关于云原生技术全景式的认识框架,同时对关键技术点进行深度解析,揭示云原生技术如何助力企业实现敏捷、可靠和高效的业务运营。
119 0