阻碍云实例优化的5个常见问题

简介:

目前所推出的公有云环境(如AWS,微软Azure和谷歌云平台),已经成为企业在IT基础架构资源上节省资金的一种手段。不幸的是,情况并非如此。云端产品日益增加的复杂性以及大多数组织对这些环境的不可见性使得难以有效控制成本。许多组织在公有云中无意识地导致过度配置,而这个错误的代价太高,企业对此无法忽视。通过避免五个最常见的错误,企业可以最大限度地提高云计算资源效率,并降低业务在这些新环境中的性能风险。

错误1:不了解详细的应用程序工作负载模式

并不是所有的工作负载都是平等的,无论企业正在采用哪个公有云,最大的问题就是关于云实例选择的细节。理解工作负载的用途和工作负载利用模式的详细性质,这一点很重要。

在每个月底完成一次工作的公有云中运行批处理工作负载的经济性与那些全天忙于各种高峰和低谷的应用程序有很大的不同。要正确地选择正确的资源和云实例,企业确实需要了解一天之内工作负载模式以及该模式如何在业务周期中发生变化。

不幸的是,许多组织采取简单的方法分析其工作量,而只查看每天的平均数或百分位数并不是彻底的方法,不能深入地了解具体的模式。结果是对资源需求的不准确的描述,这可能导致过度配置和性能问题。这些简单的方法很少做到正确。当企业在寻找帮助其选择正确的云实例的解决方案时,请选择真正了解工作负载的详细使用模式的东西。

错误#2:没有利用基准来平衡平台之间的数据

调整云计算资源分配的一个常见方法是在从一个虚拟环境或云环境移动到另一个虚拟环境或云环境时,将其分配差不多的大小。这意味着将工作负载分配给旧的资源。但并不是每个环境都运行相同规格的硬件。如果企业不使用基准来规范工作负载数据,并适应环境中底层硬件之间的性能差异,那么就无法准确地了解该工作负载将如何在新环境中执行。

较新的环境通常具有更强大的硬件,从而使企业更容易获得回报,因此,工作负载并不需要分配相同数量的资源。这是在转换服务器和优化公有云使用时的关键所在,因为提供者不断提供新硬件上运行的更新的云实例类型。为了避免大量占用资金,你需要能够进行比较,唯一的办法就是通过数据的标准化。

错误3:着眼于调整规模,并忽视现代化的工作量

将工作负载实现现代化,在更新的性能更强大的硬件上运行版本更新的云实例产品,可以成为降低成本的有效手段。事实上,人们已经发现,适当规模的实例可以在公有云计算中节省20%的成本,而现代化和适当的调整则平均节省了41%的成本。

随着公有云供应商提供的服务和实例类型多的令人眼花缭乱,企业很难选择适合的实例,更不用说跟上新的选择。尽管潜在的节省成本值得努力。要做到这一点,需要详细了解工作负载,云实例目录,成本以及规范化数据的能力,以解决环境之间的性能差异。这不是人工可以完成的,需要进行彻底的分析才能找到正确的组合来节省资金并确保业绩。这也是应该定期完成的事情,甚至几个月前部署的应用程序可能就是很好的候选者。

错误4:陷入“Bump-up循环”

“Bump-up循环”是一个恶性的循环,会导致过度配置和超支。假设工作负载正在运行,其CPU使用率是100%。采用一个简单的工具将会看到这一点,认为它的配置不足,并且建议调高CPU资源(以及云实例的成本)。这里的问题是某些工作负载将使用与它们相同的资源。如果提供更多的CPU,这些应用程序将采用它,仍然运行在100%,也许只是更短的时间。这个循环重复执行,被困在代价昂贵的Bump-up循环中。

为了避免这种资源吸引循环,您需要准确了解工作负载的工作情况以及其工作原理。再次,我们回到需要了解各个工作负载模式和工作负载的性质。当查看内存时,这是特别重要的,这是云计算成本的主要驱动力。

错误5:无法管理空闲的僵尸实例

大多数组织没有一个有效的过程来识别空闲的“僵尸”实例,导致他们随着时间的推移而堆积。它们通常是由于仓促地为短期部署实例而忘记关闭实例的结果。僵尸实例只是浪费预算。为了避免这种不必要的成本,组织必须使用足够的历史来查看整个业务周期(数周或数月)的工作量模式。识别和消除这种实例可以节省成本,但它需要比大多数工具提供更长期的工作量可见性。

大多数组织没有意识到他们在公有云中花费的费用是多少。节省这笔资金需要更加注意了解企业工作负载如何利用资源以及他们真正需要在不影响性能的前提下尽可能高效地工作。要明白细节是避免云预算超支的唯一途径。 


本文作者:Andrew Hillier

来源:51CTO

相关文章
|
6月前
|
人工智能 关系型数据库 Serverless
Serverless 应用引擎常见问题之AI应用限制人为限制内存如何解决
Serverless 应用引擎(Serverless Application Engine, SAE)是一种完全托管的应用平台,它允许开发者无需管理服务器即可构建和部署应用。以下是Serverless 应用引擎使用过程中的一些常见问题及其答案的汇总:
191 3
|
6月前
|
搜索推荐 云计算
云开发对学生的影响
云开发对学生的影响
|
关系型数据库 MySQL 网络安全
KaliLinux常见问题与解决方案
KaliLinux常见问题与解决方案
580 2
|
3月前
|
存储 测试技术
阿里云块存储问题之测试不聚焦可能导致测试不稳定如何解决
阿里云块存储问题之测试不聚焦可能导致测试不稳定如何解决
46 3
|
1月前
|
NoSQL 关系型数据库 OLAP
如何选择最合适的数据库,帮助企业及个人业务更好的开展
如何选择最合适的数据库,帮助企业及个人业务更好的开展
|
2月前
|
存储 弹性计算 SDN
企业级 ECS 集群的构建需要综合考虑多个因素,通过不断的比较和对比不同的方案,选择最适合企业自身需求和发展的架构。
【9月更文挑战第5天】在数字化商业环境中,构建企业级ECS(弹性计算服务)集群对提升业务稳定性、扩展性和性能至关重要。本文将比较传统物理服务器与ECS架构,分析云服务商选择(如AWS和阿里云)、实例配置(CPU/内存)、网络架构(SDN vs 传统)及存储方案(本地存储 vs 云存储),帮助企业根据自身需求选出最优方案,实现高效稳定的ECS集群部署。
70 18
|
4月前
|
存储 缓存 监控
通用研发提效问题之动态调整干预能力,如何解决
通用研发提效问题之动态调整干预能力,如何解决
|
3月前
|
Serverless Cloud Native 关系型数据库
Serverless集群资源随业务负载动态弹降特性的重点评测
Serverless集群资源随业务负载动态弹降特性的重点评测
|
4月前
|
弹性计算 运维
可观测性体系问题之ECS管控中覆盖软件开发生命周期如何解决
可观测性体系问题之ECS管控中覆盖软件开发生命周期如何解决
26 0
|
6月前
|
机器学习/深度学习 API 网络安全
视觉智能平台常见问题之服务部署在pdd的服务器上调用会报错如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
246 4