衡量云性能:我们需要一把不同于以往的标尺

简介:

正如开尔文勋爵所言:“衡量的目的在于了解。”不过这项简单的格言实现起来却难度极高。其真实含义分为以下两点。

第一层含义非常明确:我们无法在不加以衡量的情况下,对事物加以认知。举例来说,如果大家希望快速了解应用程序的运作情况,那么必须选取几项关键并加以追踪。“良好的性能”意味着功能可在短时间内完成,而糟糕的性能则代表着功能要耗时极久才能实现。

另一项重要指标在于,应用本身是否拥有“理想的性能”。例如,性能是否在不同负载条件下保持稳定,或者在应用的不同组件之间保持稳定?

而第二层含义则相对隐晦,但却同样重要:通过定义衡量标准,我们实际上也是在定义自身的知识界线。在应用环境当中,这可能并不是什么大问题; 但云环境则提出了完全不同的挑战。由于我们无法对环境加以全面控制,因此不能衡量一切将变得非常可怕。

当应用被迁移至云端

有鉴于此,当将服务迁移至云端时,大家必须切实利用衡量手段掌握用户的使用体验。如果做不到这一点,或者同时只能关注同一项指标,那么我们将很难做出正确的判断。

例如,在传统Web应用环境当中,我们往往会将与页面加载或者渲染速度指标视为其它组件的性能参照。例如,缓慢的页面加载速度可能意味着数据库后端存在故障或者承受的强度过大。

不过这种思考方式明显有着自己的局限:其假定应用之间的连接并不存在问题。在内部运作的基础设施当中,我们可以以此为前提进行排查——这种作法非常合理。但在云环境中,问题显然没那么单纯。

云改变了一切

在云环境内,这种假设不再成立。我们的云服务供应商会随时变更当前环境,且整个重新配置过程完全超出大家的控制范围。服务本身就是我们付费所应得的范畴,再无其它!而如果想像内部基础设施那么租赁完整的云资源,那么成本则会超出承受能力。

事实上,我们之所以将负载交由云环境打理,是因为其能够提供传统数据中心所无法企及的容量上限。这意味着底层基础设施——包括服务运行所在的网络、硬件乃至环境——始终作为变量存在。

这当然不是坏事,但问题在于衡量众多独立变量会带来巨大挑战。幸运的是,云环境本身提供了一种能够切实完成管理任务的办法:

获取数据:大多数云服务提供单个指标或者查询机制,即使您所选择的供应商不提供相关方案,也可求助于其它厂商。每秒总线信息、存储操作、计算资源使用量等等都能够成为把握底层服务动态的线索。

处理数据:

一部分云服务会聚合数据并以易于使用的方式集中提供。大家可以借此随时检查数据流量,这也应当成为任何形式的云系统的必要配套方案。

数据可视化:

大多数数据聚合服务都提供多种可视化工具。运维人员可随后借此讨论并向管理层解释当前运行状况,并确保一切处于“基准”范围内。只有把握住这种“正常”状态,异常问题才能被及时发现。

确保应用生成有价值数据:

应用日志通常分为两种类型:全面调试与停止发报。确保应用能够生成有价值且具备可操作性的指标。

不要仅依赖单一来源:

如果大家只使用当前云服务厂商提供的衡量指标,那么恐怕无法保证审计合格。正如良好的财务控制与审计是保障业务成功的关键,我们在技术层面需要采取同样的心态。事实上,大家不妨以怀疑的态度审视一切,并在必要时求助于第三方厂商。

当然,云服务供应商本身往往是最先发现问题的一方。遇到这种情况,我们应当与外部监控厂商交流问题,从而建立更可靠、更及时的衡量体系。


本文作者:谭盼雨

来源:51CTO

目录
打赏
0
0
0
0
192
分享
相关文章
探索软件测试中的“禅”:寻找内在的平和与外在的效率####
在软件测试的世界里,我们常常被缺陷的数量、测试用例的覆盖度以及上线时间的紧迫性所困扰。但如果我们能像禅宗修行者一样,将注意力转向内心的平静与专注,或许能在纷繁复杂的测试工作中找到一种全新的效率和质量提升之道。本文将带您走进软件测试的“禅意世界”,探讨如何在看似枯燥无味的测试过程中,通过调整心态、优化方法,实现个人成长与项目成功的双赢。 ####
|
3月前
|
UED
别让细节拖累你的产品:学会权衡才是硬道理
在产品管理中,细节优化与整体推进之间的平衡至关重要。本文探讨了“抠细节”的利弊,并提出了确定优先级、设定阈值、数据驱动、强化团队协作、保持开放心态及学会妥协等平衡策略,帮助产品经理在细节与全局之间找到最佳平衡点,实现产品成功。
【2023高教社杯】A题 定日镜场的优化设计 问题分析及数学模型
本文介绍了2023年高教社杯数学建模竞赛A题的定日镜场优化设计问题,涉及问题分析和数学模型构建,旨在提高太阳能光热发电效率并实现电力系统的新能源转型。
155 1
【2023高教社杯】A题 定日镜场的优化设计 问题分析及数学模型
"解锁hyengine编译性能新纪元:快路径优化技术揭秘,直击热点代码效率瓶颈,让你的应用飞起来!"
【8月更文挑战第21天】hyengine是一款现代化编程引擎,其编译性能直接影响应用质量。针对直接翻译opcode至机器码效率低下的问题,hyengine采用快路径优化策略,专注于热点代码的深度优化,以减少运行时开销。例如,通过循环展开技术减少控制指令开销,智能判断循环展开时机与程度。此外,还运用函数内联等技术进一步提升性能,如内联小函数以减少调用开销。未来将持续探索更多优化方案,提升用户体验,并欢迎开发者共同参与技术进步。
75 2
图神经网络加持,突破传统推荐系统局限!北大港大联合提出SelfGNN:有效降低信息过载与数据噪声影响
【7月更文挑战第22天】北大港大联手打造SelfGNN,一种结合图神经网络与自监督学习的推荐系统,专攻信息过载及数据噪声难题。SelfGNN通过短期图捕获实时用户兴趣,利用自增强学习提升模型鲁棒性,实现多时间尺度动态行为建模,大幅优化推荐准确度与时效性。经四大真实数据集测试,SelfGNN在准确性和抗噪能力上超越现有模型。尽管如此,高计算复杂度及对图构建质量的依赖仍是待克服挑战。[详细论文](https://arxiv.org/abs/2405.20878)。
142 5
(文章复现)梯级水光互补系统最大化可消纳电量期望短期优化调度模型matlab代码
参考文献: [1]罗彬,陈永灿,刘昭伟等.梯级水光互补系统最大化可消纳电量期望短期优化调度模型[J].电力系统自动化,2023,47(10):66-75.
|
10月前
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
|
10月前
R语言逐步多元回归模型分析长鼻鱼密度影响因素
R语言逐步多元回归模型分析长鼻鱼密度影响因素
|
10月前
|
所有消除游戏背后都有一张看不见的网格
所有消除游戏背后都有一张看不见的网格
128 0
所有消除游戏背后那张看不见的网格
观察一下上方的这一系列各种各样的消除游戏的图片,它们都有着这样的一个共同点,就是都是按照行列进行布局,有 7 行 7 列,有 10 行 10 列的。这样的行列布局是不是特别的像一个“网格”?这就是我们今天要讲的,所有消除游戏背后都有的那张看不见的“网格”。
128 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等