虚拟基础设施资源监控的最佳实践

简介:

现在,我们要看一看现代数据中心一个非常关键的监控和资源管理方面:虚拟化层(逻辑层)。

几乎所有的分析师都认为,如今的数据中心是主要业务计划背后的驱动引擎。最重要的是,现在各组织在很大程度上依赖于他们的数据中心,实现其现实世界的战略和能力。然而,最大的挑战实际是创建可以查看数据中心的一些最先进的功能的监控和报警系统。

我们知道,虚拟化技术将使我们在提供应用程序,工作负载和关键数据点方面不断革新。我们也知道,数据中心已经发展,以支持更高层次的密度和新的业务举措。但是,你如何对此了如指掌呢?你如何主动地管理数据中心的一个最关键的业务组成部分?最重要的是,你如何优化你的整个虚拟化生态系统,以确保适当的业务与数据中心匹配?

要做到这一点,最好的办法是采有一种新的方式来监控和管理数据中心和虚拟化系统。考虑到这一点,让我们先从逻辑层开始:虚拟化。

每台服务器部署一个应用程序的日子即将结束。通过虚拟化,IT部门可以安装大量的虚拟机,可以让操作系统和工作负载满负载运行,包括单件硬件这在几年前是不可能实现。而实现虚拟化最大的部分是:你可以同时运行这些工作负载,其性能损失可以忽略不计的。

当涉及到一个健康的生态系统的虚拟化工作,还有一个应该监测指标的集合名单。这其中包括:

(1)内存

·主机内存使用率。

·VMRAM使用。

(2)磁盘存储

·SAN上的磁盘空间。

·在虚拟机上的空间利用率。

(3)中央处理器

·这两个虚拟CPU和主机CPU应检查。

(4)网络I/O

·检查虚拟机周围流量繁忙模式。避免出现瓶颈是。

(5)广域网

·确保远程链接操作正常。

·站点之间的链路饱和,必须进行监测。

请记住,有很多原因可能导致资源被秒杀。在环境中的问题将导致出现的问题,一个编程循环可以使一个CPU宕机,或者甚至饱和的链接导致网络错误。你必须积极地制定此计划,让系统的正常运行。这意味着需要预测潜在的基础设施尖峰,并有能力处理。

考虑下面这个例子:

一个旅行社所有的系统都是虚拟化的。工作人员知道一个特定的季节来临时,会体验到使用尖峰的情况。因此,在繁忙的假日或销售季节,其服务器可能会遭到一个巨大的打击。为了适应这一点,企业担心虚拟机超载,并利用一种自动化工作流和基础设施业务流程进行处理。那就是,如果一个主机固定了资源请求,并且当前运行的虚拟机无法承受负荷时,自动化软件将会关闭这个上虚拟机,并在单独的主机开启额外的虚拟机来帮助处理负载。这个过程可以完全自动化,以确保业务的连续性和最小的业务中断。

所以,在为你的虚拟化生态系统购买任何类型的资源监控软件时,请确保它能够回答以下问题:

·有多少台虚拟机,哪些是过高或过低配置的?

·在虚拟化环境中的性能瓶颈?

·如何配置虚拟机?

·目前的环境下有多少应用程序服务器,什么时候将需要更多的资源?

·什么部门都在使用哪些资源?

·如何在一段时间内跟踪服务器利用率?

此外,许多IT管理人员通常会希望有他们采用的管理软件有三个主要特点:

(1)容量管理

·主动监控、预测、检测和排除实时仪表板的故障和报警能力的瓶颈

·确定最佳的虚拟机的位置,探索假设情景,解决识别能力不足的问题,并确定特定应用的容量需求

(2)虚拟机蔓延控制

·查找空闲/陈旧的虚拟机,孤立的文件,以及过度分配的虚拟机

(3)性能监测

·主动监控虚拟化特有的性能问题

·深入分析存储I/O到虚拟化和私有云部署的独特问题

·排除应用程序和工作量问题

·使用灵活的警报和集成的建议,快速发现和行动的性能问题

最后的思考

创建一个虚拟机从未如此简单。只需点击几下鼠标,你就有一个新的虚拟机整装待发。有了这样简单的规划则更需要一些重要的注意事项。要花时间去研究你的环境,了解需求,然后部署虚拟机。

很多时候,IT管理员在部署虚拟机时,可以会导致虚拟机蔓延,并可能难以管理。

在收集指标和了解独特的环境时,在一段时间内监控你的结果。通过这种方式,你就可以知道高峰使用时间,哪台机器负载最严重,以及正在发生的瓶颈或I/O问题。

更多的IT经理利用自己的监测信息,他们能够对虚拟基础架构作出更好的决定。有了这样的工具,他们能够利用宝贵的资源环境实现最佳部署。





====================================分割线================================


本文转自d1net(转载)

目录
相关文章
|
7月前
|
机器学习/深度学习 运维 监控
构建高效可靠的云基础设施:自动化运维策略解析
【4月更文挑战第12天】 随着云计算的普及和企业信息化水平的不断提升,构建一个高效、稳定且可扩展的云基础设施已成为众多组织的技术挑战。本文将深入探讨自动化运维在云环境中的实践与应用,分析其对提升系统可靠性、效率及敏捷性的重要性,并提出一系列切实可行的自动化策略。我们将从持续集成与持续部署(CI/CD)、配置管理、监控告警和灾难恢复等方面展开讨论,并结合案例分析来揭示这些策略如何帮助组织实现云基础设施的优化管理。
122 6
|
2月前
|
存储 监控 安全
虚拟化资源监控
【10月更文挑战第18天】资源监控是确保IT设施可用性、可靠性和安全性的重要手段。随着虚拟化技术的发展,新的监控工具应运而生,以应对虚拟化层(Hypervisor)的监控需求。资源监控不仅涵盖物理设施、操作系统、应用与服务,还需关注虚拟资源的动态调整特性。虚拟化环境中的监控主要包括状态监控、性能监控、容量监控、安全监控和使用量度量等方面。通过日志分析、包嗅探和探针采集等方法,监控系统可以收集和分析关键数据,为容量规划、资源度量和安全防护提供支持。
|
5月前
|
运维 监控 调度
《<灵活调度,高效编排,容器化管理云上应用>解决方案测评》
在这次测评中,聚焦于技术细节、引导帮助、代码示例、容器托管优势及云产品体验五大方面。技术细节展示出色但需深化复杂场景的优化策略;文档和引导能满足基本需求,但关键步骤应增强提示;代码示例有价值,但遇到实际使用问题;容器化托管带来快速部署、资源隔离和自动化管理的优势,受到高度评价;云产品功能齐全,性能良好,但高级功能配置和手册可读性有待提升。总体而言,解决方案有亮点,期待持续改进。
177 13
《<灵活调度,高效编排,容器化管理云上应用>解决方案测评》
|
4月前
|
存储 运维 监控
基础设施和环境管理
基础设施和环境管理
46 1
|
7月前
|
运维 监控 Kubernetes
构建高效自动化运维体系:基于容器技术的持续部署策略
【5月更文挑战第27天】 在现代IT基础设施的管理中,自动化运维已成为提升效率、保障稳定性的关键因素。本文将探讨如何利用容器技术实现服务的快速部署和可靠运行,以及构建一个高效的自动化运维体系。通过深入分析容器化的优势与挑战,并提出一个切实可行的持续部署策略,旨在帮助运维团队优化现有流程,应对快速变化的业务需求。
|
7月前
|
弹性计算 人工智能 调度
弹性调度助力企业灵活应对业务变化,高效管理云上资源
本文主要介绍了弹性调企业灵活应对企业业务变化,并高效管理云上资源。
145793 119
|
7月前
|
运维 监控 安全
运维监控的作用
运维监控的作用
222 0
|
7月前
|
Cloud Native 测试技术 持续交付
构建高效稳定的云原生应用部署策略云端防御:云计算环境中的网络安全与信息保护策略
【5月更文挑战第27天】 在快速迭代和持续交付成为企业软件开发新常态的今天,如何确保云原生应用的部署效率与稳定性是每个运维工程师面临的重要挑战。本文将探讨一种综合性部署策略,该策略结合了容器化技术、微服务架构、自动化测试以及持续集成/持续部署(CI/CD)流程,旨在为现代云原生应用提供一个可靠且高效的部署模式。通过分析传统部署模式的不足,并引入先进的技术和实践,我们的目标是降低部署风险,提高部署速度,同时确保产品质量和服务的稳定性。
|
7月前
|
监控 安全 云计算
云端防御战线:云计算环境下的网络安全策略构建高效稳定的Docker容器监控体系
【5月更文挑战第27天】 在数字化时代的浪潮中,云计算已成为企业与个人存储和处理数据的重要平台。然而,随着云服务使用率的飙升,网络威胁也愈发狡猾且复杂。本文将深入探讨在云计算环境中维护网络安全的挑战及策略,重点分析信息安全的关键组成部分,并提出多层次防御模型以增强云环境的数据保护能力。通过剖析最新的安全技术与实践,我们旨在为读者提供一套全面的网络安全解决方案蓝图。
|
监控 安全 Cloud Native
云原生环境下的安全实践:保护应用程序和数据的关键策略
云原生环境下的安全实践:保护应用程序和数据的关键策略
596 0
云原生环境下的安全实践:保护应用程序和数据的关键策略