人工智能如何解决数据中心的工作负载管理难题

简介: 人工智能如今为实现数据中心的基本管理任务自动化做好了准备。但是,数据中心管理人员准备好从人工管理过渡到机器管理了吗?

随着数据中心工作负载量呈螺旋式增长,越来越多的企业开始寻求采用人工智能技术帮助他们减轻IT团队的管理负担,同时提高效率,并削减开支。

人工智能承诺将工作负载自动实时管理功能应用在基础设施,无论是在内部部署数据中心还是在由数据中心、云平台和边缘计算设备组成的混合云环境中。随着人工智能为工作负载管理带来的转变,未来的数据中心将与现在的数据中心设施大不相同。一种可能的方案是由远程管理员管理的小型互连边缘数据中心的集合。

image.png

专注于数据中心业务和技术趋势分析的Infosys Knowledge Institute负责人Jeff Kavanaugh表示,由于竞争加剧、通货膨胀以及疫情导致的预算削减各种因素,许多企业正在寻求降低数据中心运营成本的方法。人工智能和自动化已经被证明是工作量管理中的强大工具,因为它可以将企业的员工从耗时且乏味的任务中解放出来,并使他们能够专注于真正需要人工处理的工作。

满足需求
大多数数据中心管理人员的首要任务是优化运营以满足高峰需求。然而,无论他们如何仔细地计划和准备,需求高峰和低谷往往无法控制。商业咨询机构Capgemini公司北美地区人工智能工程副总裁Goutham Belliappa说:“人工智能可以带来独特改进的地方在于它可以理解工作负载的模式,并将这些需求与数据中心容量相匹配。”

人工智能管理可以使数据中心团队从一系列平凡而重复的任务中解脱出来,其中包括服务器管理、安全设定、计算、内存和存储优化、负载均衡,以及电力和冷却分配等。科技市场咨询机构ABI Research公司首席分析师Lian Jye Su说,“这些工作负载都可以通过人工智能实现自动化或增强。”

IT管理软件开发商Manage Engine公司人工智能和机器学习产品总监Ramprakash Ramamoorthy表示,人工智能可以帮助分析从单个机器收集的数据,并发现被监控参数中的异常情况。他说,“人工智能还可以帮助更早地预测故障和中断,这可以帮助数据中心管理团队减少停机时间,并保持集群正常运行。人工智能还可以实现更好的温度和电压管理,从而直接降低运营成本,并帮助减少碳足迹。”

Ramamoorthy表示,虽然可以使用各种人工智能方法,但工作负载管理工具应始终确保模型预测是完全可解释的。与其他领域相比,人工智能系统在数据中心工作负载管理中做出的决定通常会由一个或多个协同工作的团队来执行。因此,人工智能模型决策应该是可解释的,让IT团队能够更好地理解模型决策的意图,并采取相应的行动。

他指出,“人工智能模型最多可以达到80%到85%的准确度,因此这也有助于人类团队通过正确解释人工智能模型的决策来关联明智的决策。如果人工智能模型可以为其呈现的决策提供置信度评分,那么它也将有助于有效的工作负载管理。”

人工智能和机器学习开发商Tanjo公司联合创始人兼首席执行官Richard Boyd表示,随着人工智能和机器学习工具变得越来越普遍,很多企业认识到,当人类智能与技术合作而不是竞争时,可以实现最佳结果。他说,“机器在许多方面根本无法取代人类,但机器在某些领域的应用肯定比人类好得多。一旦人工智能和机器学习变得流行,并且企业员工适应这种新的合作关系,那么他们的观点就会发生转变。”

Dell科技公司的人工智能战略负责人Brons Larson表示,数据中心可以利用人工智能/机器学习来提高性能以及优化配置和部署。人工智能/机器学习支持动态协调资源与工作负载,以优化资源利用率以更好地管理成本。所有人工智能解决方案,无论是何种应用程序或供应商,都需要专业知识来正确配置和优化价值。这首先要正确捕获和评估用于训练和测试的数据,以及针对漂移和偏差管理部署的模型。

此外,基于规则的人工智能可以通过智能策略控制和预定义配置帮助自动化资源优化和合规性。Su指出,“使用从日常运营中收集的数据,基于机器学习的人工智能可以进一步增强数据中心运营的其他方面,这些方面以前需要深入的领域专业知识。例如,可以通过自学威胁检测和监控算法来加强数据中心的安全性。通过将所需资源引导到正确的方向,可以优化负载均衡、电源和冷却分配功能。”

Kavanaugh说,“人工智能还可以简化数据管理。企业越来越发现自己被与关键利益相关者有关的大量数据所包围。使用人工智能,企业可以确保有效、准确地管理这些大量数据。”在人工智能的帮助下,企业的IT团队可以比以往更快、更准确地执行数据质量分析或提取数据以创建预测等任务。他说,“这对企业来说至关重要,因为他们需要更准确的数据来做出明智的决策。”

人工智能软件包
随着人工智能的成熟,现在出现了一种软件驱动的方法,可以将不同的元素结合在一起,并将人工干预降至最低。例如,在典型的数据库系统中,需要大量配置才能使操作高效运行,例如索引表、跨服务器对数据进行分区、为某些类型的查询分配内存以及调整优化器以适应计算平台和预期的工作量。Howe指出,“人工智能可以通过从大量历史数据中学习规则和程序来提供帮助,关于哪些日程安排对哪些任务有效,而不是让我们试图弄清楚所有事情。”

有了人工智能,企业IT领导者和团队可以自由地专注于解决业务问题,而不必担心基础设施的细节。Belliappa说,“从人工智能的角度来看,我们使用的大多数模型都是自学习集成模型,它们结合使用各种技术,并在从它们管理的工作负载模式中学习时不断优化。”

规划和部署
在人工智能开始发挥其管理魔力之前,IT和业务领导者需要接受将关键管理职责移交给软件的想法。Shah说,“根据其规模和内部知识库,人工处理可能非常困难。”

最终,企业如何处理从人工到人工智能工作负载管理的过渡取决于其技术成熟度、运营规模和数据中心的活力。Kavanaugh说,“缺乏现代基础设施来有效利用其数据的孤立企业将陷入困境。”另一方面,越来越多的人工智能供应商提供针对特定类型企业的工具,这增加了几乎任何类型和规模的企业能够平稳过渡的可能性。他预测说,“随着企业及其解决方案的成熟,配置和部署的便利性将会继续提高,”

如果说人工智能有致命弱点的话,那就是该技术对数据中心系统和实践中甚至相对微妙变化的反应。Howe解释道,“大多数人工智能技术都是在假设固定环境的情况下寻找稳定的模式。如果以模型无法看到的方式改变环境,它会提供错误的答案。而在部署更改之前仔细规划可以帮助减轻这种担忧。”

人工智能得到更广泛的应用
虽然人工智能驱动的数据中心工作负载管理已经被许多大型企业使用,特别是谷歌、亚马逊和微软等超大规模企业,但规模较小的数据中心运营商直到现在才开始采用这项技术。Belliappa指出,用不了多久,数据中心管理人员将面临一个严峻的选择:或者继续依赖传统的数据中心管理技术和实践,或者大量投资于人工智能驱动的业务以保持活力。

从长远来看,随着技术的进步、成本的下降以及采用者信心的增强,人工智能驱动的管理有望成为主流。Shah预测说,“在接下来的四到六年内,人们将看到人工智能数据中心工作负载管理技术成为标准选项。”

Howe说,““我认为这种趋势正在迅速发展,随着数据中心自动化程度的提高,人工智能技术提供了一种更好的方法来利用提供商拥有大量数据的内容。”他预计使用人工智能学习方法的自动化工作负载管理将很快变得司空见惯。

Kavanaugh说,“越来越多的行业观察家认为人工智能将在未来三四年内的某个时候开始主导数据中心管理,尽管疫情的驱动可能有助于推动这一时间表向前推进。数据中心很快将能够实现几乎所有操作的自动化,从网络安全到维护再到监控。但是,随着数据量呈指数级增长,以及企业发现人工智能的新用途,数据中心管理人员的工作量及其管理将会继续增长。”

目录
相关文章
|
6月前
|
机器学习/深度学习 数据挖掘 物联网
【专栏】机器学习如何通过预测性维护、负载预测、动态冷却管理和能源效率优化提升数据中心能效
【4月更文挑战第27天】随着信息技术发展,数据中心能耗问题日益突出,占全球电力消耗一定比例。为提高能效,业界探索利用机器学习进行优化。本文讨论了机器学习如何通过预测性维护、负载预测、动态冷却管理和能源效率优化提升数据中心能效。然而,数据质量、模型解释性和规模化扩展是当前挑战。未来,随着技术进步和物联网发展,数据中心能效管理将更智能自动化,机器学习将在实现绿色高效发展中发挥关键作用。
126 5
|
4月前
|
机器学习/深度学习 数据采集 人工智能
ERP系统中的人工智能与机器学习应用:提升企业智能化管理
【7月更文挑战第29天】 ERP系统中的人工智能与机器学习应用:提升企业智能化管理
587 0
|
4月前
|
机器学习/深度学习 人工智能 运维
智能化运维的崛起:自动化与人工智能在IT管理中的融合
本文深入探讨了智能化运维在现代企业中的重要性,并分析了自动化技术和人工智能(AI)如何共同推动IT运维管理的革新。文章首先概述了传统运维面临的挑战,然后详细介绍了智能化运维的核心概念和实施步骤,最后通过具体案例展示了智能化运维在实际工作中的应用效果和潜在价值。
131 0
|
5月前
|
人工智能 安全 算法
如何规范和管理人工智能的发展和应用
如何规范和管理人工智能的发展和应用
|
6月前
|
机器学习/深度学习 运维 算法
利用机器学习优化数据中心的能效管理
【4月更文挑战第30天】在数据中心的运营成本中,能源消耗占据了一个显著的比例。随着能源价格的上升和环境保护意识的增强,如何降低能源消耗成为数据中心管理者们面临的一个重要挑战。本文探讨了一种基于机器学习的方法来优化数据中心的能效管理,通过分析历史数据和实时监测数据,动态调整资源分配和冷却策略,以实现能源消耗的最小化。
|
6月前
|
机器学习/深度学习 资源调度 算法
利用机器学习优化数据中心的能效管理
【5月更文挑战第31天】 在数据中心管理和运营中,能效优化是降低运营成本和减少环境影响的关键。本文提出了一种基于机器学习的方法来动态调整数据中心的资源分配,旨在提高整体能源效率。该方法通过分析历史数据和实时负载信息,预测未来工作负载并相应地调整硬件配置。实验结果表明,与传统的静态管理策略相比,所提出的动态管理策略可以显著降低能耗,同时保持服务质量。
|
6月前
|
机器学习/深度学习 缓存 算法
深入理解操作系统的虚拟内存管理利用机器学习技术优化数据中心能效
【5月更文挑战第25天】 在现代计算机系统中,虚拟内存是允许用户程序逻辑地址空间与物理内存解耦的关键概念。它为每个进程提供了一个独立的、连续的地址空间,通过内存管理单元(MMU)硬件的支持,将程序使用的虚拟地址映射到实际的物理内存地址。这种机制不仅简化了程序的编写和内存的管理,还提供了保护机制,防止不同进程之间的相互干扰。本文将探讨虚拟内存的工作原理、分页系统的实现以及虚拟内存带来的性能影响,并讨论操作系统如何优化内存使用和管理。
|
6月前
|
机器学习/深度学习 存储 算法
利用机器学习优化数据中心的能效管理
【5月更文挑战第23天】在本文中,我们探讨了一种基于机器学习的方法来优化数据中心的能效管理。通过分析历史数据,我们的模型能够预测数据中心的能源需求,并据此调整能源分配,以达到节能和提高能效的目标。这种方法不仅能够降低运营成本,还能减少对环境的影响。
|
6月前
|
机器学习/深度学习 数据采集 算法
利用机器学习优化数据中心的能耗管理
在数据中心管理和运营领域,能耗优化是提高经济效益和环境可持续性的关键。本文提出了一种基于机器学习的方法来优化数据中心的能源消耗,通过实时监控与智能调节系统参数以降低总体能耗。研究采用多种算法对比分析,包括监督式学习、非监督式学习以及强化学习,并在此基础上设计出一套综合策略。该策略不仅提升了能效比(PUE),还保证了系统的高可靠性和性能稳定性。文章的结构首先介绍数据中心能耗管理的重要性,然后详细阐述所提出的机器学习模型及其实现过程,最后通过实验结果验证了方法的有效性。
|
6月前
|
机器学习/深度学习 存储 大数据
利用机器学习优化数据中心的能效管理
【2月更文挑战第17天】 在数据中心的运营过程中,能效管理是维持可持续性和成本效益的关键。本文探讨了一种基于机器学习的方法来优化数据中心的能源使用效率。通过分析历史能耗数据和实时工作负载信息,构建了一个预测模型来指导冷却系统的动态调整,以减少不必要的能源消耗。实验结果表明,该方法能够有效降低能耗,同时保证数据中心的性能和可靠性。
70 2