虚拟基础设施资源监控的最佳实践

简介:

现在,我们要看一看现代数据中心一个非常关键的监控和资源管理方面:虚拟化层(逻辑层)。

几乎所有的分析师都认为,如今的数据中心是主要业务计划背后的驱动引擎。最重要的是,现在各组织在很大程度上依赖于他们的数据中心,实现其现实世界的战略和能力。然而,最大的挑战实际是创建可以查看数据中心的一些最先进的功能的监控和报警系统。

我们知道,虚拟化技术将使我们在提供应用程序,工作负载和关键数据点方面不断革新。我们也知道,数据中心已经发展,以支持更高层次的密度和新的业务举措。但是,你如何对此了如指掌呢?你如何主动地管理数据中心的一个最关键的业务组成部分?最重要的是,你如何优化你的整个虚拟化生态系统,以确保适当的业务与数据中心匹配?

要做到这一点,最好的办法是采有一种新的方式来监控和管理数据中心和虚拟化系统。考虑到这一点,让我们先从逻辑层开始:虚拟化。

每台服务器部署一个应用程序的日子即将结束。通过虚拟化,IT部门可以安装大量的虚拟机,可以让操作系统和工作负载满负载运行,包括单件硬件这在几年前是不可能实现。而实现虚拟化最大的部分是:你可以同时运行这些工作负载,其性能损失可以忽略不计的。

当涉及到一个健康的生态系统的虚拟化工作,还有一个应该监测指标的集合名单。这其中包括:

(1)内存

·主机内存使用率。

·VMRAM使用。

(2)磁盘存储

·SAN上的磁盘空间。

·在虚拟机上的空间利用率。

(3)中央处理器

·这两个虚拟CPU和主机CPU应检查。

(4)网络I/O

·检查虚拟机周围流量繁忙模式。避免出现瓶颈是。

(5)广域网

·确保远程链接操作正常。

·站点之间的链路饱和,必须进行监测。

请记住,有很多原因可能导致资源被秒杀。在环境中的问题将导致出现的问题,一个编程循环可以使一个CPU宕机,或者甚至饱和的链接导致网络错误。你必须积极地制定此计划,让系统的正常运行。这意味着需要预测潜在的基础设施尖峰,并有能力处理。

考虑下面这个例子:

一个旅行社所有的系统都是虚拟化的。工作人员知道一个特定的季节来临时,会体验到使用尖峰的情况。因此,在繁忙的假日或销售季节,其服务器可能会遭到一个巨大的打击。为了适应这一点,企业担心虚拟机超载,并利用一种自动化工作流和基础设施业务流程进行处理。那就是,如果一个主机固定了资源请求,并且当前运行的虚拟机无法承受负荷时,自动化软件将会关闭这个上虚拟机,并在单独的主机开启额外的虚拟机来帮助处理负载。这个过程可以完全自动化,以确保业务的连续性和最小的业务中断。

所以,在为你的虚拟化生态系统购买任何类型的资源监控软件时,请确保它能够回答以下问题:

·有多少台虚拟机,哪些是过高或过低配置的?

·在虚拟化环境中的性能瓶颈?

·如何配置虚拟机?

·目前的环境下有多少应用程序服务器,什么时候将需要更多的资源?

·什么部门都在使用哪些资源?

·如何在一段时间内跟踪服务器利用率?

此外,许多IT管理人员通常会希望有他们采用的管理软件有三个主要特点:

(1)容量管理

·主动监控、预测、检测和排除实时仪表板的故障和报警能力的瓶颈

·确定最佳的虚拟机的位置,探索假设情景,解决识别能力不足的问题,并确定特定应用的容量需求

(2)虚拟机蔓延控制

·查找空闲/陈旧的虚拟机,孤立的文件,以及过度分配的虚拟机

(3)性能监测

·主动监控虚拟化特有的性能问题

·深入分析存储I/O到虚拟化和私有云部署的独特问题

·排除应用程序和工作量问题

·使用灵活的警报和集成的建议,快速发现和行动的性能问题

最后的思考

创建一个虚拟机从未如此简单。只需点击几下鼠标,你就有一个新的虚拟机整装待发。有了这样简单的规划则更需要一些重要的注意事项。要花时间去研究你的环境,了解需求,然后部署虚拟机。

很多时候,IT管理员在部署虚拟机时,可以会导致虚拟机蔓延,并可能难以管理。

在收集指标和了解独特的环境时,在一段时间内监控你的结果。通过这种方式,你就可以知道高峰使用时间,哪台机器负载最严重,以及正在发生的瓶颈或I/O问题。

更多的IT经理利用自己的监测信息,他们能够对虚拟基础架构作出更好的决定。有了这样的工具,他们能够利用宝贵的资源环境实现最佳部署。





====================================分割线================================


本文转自d1net(转载)

目录
相关文章
|
8月前
|
运维 Kubernetes 监控
构建高效自动化运维系统:基于容器技术的策略与实践
【4月更文挑战第19天】随着云计算和微服务架构的兴起,传统的运维模式正逐渐向自动化、智能化转型。本文将探讨如何利用容器技术构建一个高效、可靠的自动化运维系统,涵盖系统设计原则、关键技术选型以及实践经验分享。通过引入容器技术,我们可以实现应用的快速部署、弹性伸缩和故障自愈,从而提高运维效率,降低系统维护成本。
|
8月前
|
Kubernetes 网络性能优化 调度
Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制
Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制
|
弹性计算 运维 关系型数据库
云上部署环境(基础设施)的正确姿势——使用资源编排ROS进行基础设施的部署
![image.png](https://ata2-img.cn-hangzhou.oss-pub.aliyun-inc.com/66daa0b176da97de1dc8e66580fc0384.png) # 常见的部署问题 1. 多环境部署。根据实际开发的需要,一般至少需要准备3个环境:日常测试环境,部署预发环境,部署生产环境。 2. 多地域部署。对于云产品还需要支持多地域部署
|
21天前
|
人工智能 负载均衡 安全
代理IP与科技创新:算力资源的灵活调度与高效利用
在数字化时代,互联网成为日常生活的一部分,高效利用算力资源至关重要。代理IP作为关键技术,在隐私保护、突破地域限制及算力调度方面展现独特优势。本文探讨代理IP与科技创新的融合,通过具体案例和代码示例展示其助力算力资源灵活调度与高效利用的应用场景,涵盖电商、金融、制造及媒体等领域,同时分析面临的挑战与解决方案。代理IP不仅优化网络流量管理,提高访问速度,还在AI算力集群中发挥多重作用,确保数据安全和通信稳定,为数字化创新提供有力支持。
65 3
|
6月前
|
弹性计算 运维 Kubernetes
实践篇:灵活调度,高效编排,容器化管理云上应用
【7月更文第8天】阿里云容器服务Kubernetes版(ACK)作为业界领先的容器管理和编排服务,凭借其强大的技术实力和丰富的云服务生态,为企业级用户提供了一系列卓越的优势,助力现代化应用的快速构建、部署与运维。
117 1
|
6月前
|
运维 监控 调度
《<灵活调度,高效编排,容器化管理云上应用>解决方案测评》
在这次测评中,聚焦于技术细节、引导帮助、代码示例、容器托管优势及云产品体验五大方面。技术细节展示出色但需深化复杂场景的优化策略;文档和引导能满足基本需求,但关键步骤应增强提示;代码示例有价值,但遇到实际使用问题;容器化托管带来快速部署、资源隔离和自动化管理的优势,受到高度评价;云产品功能齐全,性能良好,但高级功能配置和手册可读性有待提升。总体而言,解决方案有亮点,期待持续改进。
194 13
《<灵活调度,高效编排,容器化管理云上应用>解决方案测评》
|
8月前
|
运维 监控 Kubernetes
构建高效自动化运维体系:基于容器技术的持续部署策略
【5月更文挑战第27天】 在现代IT基础设施的管理中,自动化运维已成为提升效率、保障稳定性的关键因素。本文将探讨如何利用容器技术实现服务的快速部署和可靠运行,以及构建一个高效的自动化运维体系。通过深入分析容器化的优势与挑战,并提出一个切实可行的持续部署策略,旨在帮助运维团队优化现有流程,应对快速变化的业务需求。
|
7月前
|
分布式计算 资源调度 Hadoop
技术好文共享:资源管理与调度系统
技术好文共享:资源管理与调度系统
45 0
|
8月前
|
Cloud Native Devops 持续交付
云原生技术的未来:构建更加动态和可伸缩的系统
【5月更文挑战第30天】 在数字化转型的浪潮中,企业正迅速采用云原生技术来构建和部署应用程序。本文探讨了云原生生态系统的最新发展,并分析了如何利用这些技术实现系统的动态性和可伸缩性。我们将深入讨论容器化、微服务架构、持续集成/持续部署(CI/CD)等关键技术,并提出一个综合实践框架,帮助企业实现真正的云原生转型。
|
8月前
|
Cloud Native 测试技术 持续交付
构建高效稳定的云原生应用部署策略云端防御:云计算环境中的网络安全与信息保护策略
【5月更文挑战第27天】 在快速迭代和持续交付成为企业软件开发新常态的今天,如何确保云原生应用的部署效率与稳定性是每个运维工程师面临的重要挑战。本文将探讨一种综合性部署策略,该策略结合了容器化技术、微服务架构、自动化测试以及持续集成/持续部署(CI/CD)流程,旨在为现代云原生应用提供一个可靠且高效的部署模式。通过分析传统部署模式的不足,并引入先进的技术和实践,我们的目标是降低部署风险,提高部署速度,同时确保产品质量和服务的稳定性。