随着数据中心工作负载量呈螺旋式增长,越来越多的企业开始寻求采用人工智能技术帮助他们减轻IT团队的管理负担,同时提高效率,并削减开支。
人工智能承诺将工作负载自动实时管理功能应用在基础设施,无论是在内部部署数据中心还是在由数据中心、云平台和边缘计算设备组成的混合云环境中。随着人工智能为工作负载管理带来的转变,未来的数据中心将与现在的数据中心设施大不相同。一种可能的方案是由远程管理员管理的小型互连边缘数据中心的集合。
专注于数据中心业务和技术趋势分析的Infosys Knowledge Institute负责人Jeff Kavanaugh表示,由于竞争加剧、通货膨胀以及疫情导致的预算削减各种因素,许多企业正在寻求降低数据中心运营成本的方法。人工智能和自动化已经被证明是工作量管理中的强大工具,因为它可以将企业的员工从耗时且乏味的任务中解放出来,并使他们能够专注于真正需要人工处理的工作。
满足需求
大多数数据中心管理人员的首要任务是优化运营以满足高峰需求。然而,无论他们如何仔细地计划和准备,需求高峰和低谷往往无法控制。商业咨询机构Capgemini公司北美地区人工智能工程副总裁Goutham Belliappa说:“人工智能可以带来独特改进的地方在于它可以理解工作负载的模式,并将这些需求与数据中心容量相匹配。”
人工智能管理可以使数据中心团队从一系列平凡而重复的任务中解脱出来,其中包括服务器管理、安全设定、计算、内存和存储优化、负载均衡,以及电力和冷却分配等。科技市场咨询机构ABI Research公司首席分析师Lian Jye Su说,“这些工作负载都可以通过人工智能实现自动化或增强。”
IT管理软件开发商Manage Engine公司人工智能和机器学习产品总监Ramprakash Ramamoorthy表示,人工智能可以帮助分析从单个机器收集的数据,并发现被监控参数中的异常情况。他说,“人工智能还可以帮助更早地预测故障和中断,这可以帮助数据中心管理团队减少停机时间,并保持集群正常运行。人工智能还可以实现更好的温度和电压管理,从而直接降低运营成本,并帮助减少碳足迹。”
Ramamoorthy表示,虽然可以使用各种人工智能方法,但工作负载管理工具应始终确保模型预测是完全可解释的。与其他领域相比,人工智能系统在数据中心工作负载管理中做出的决定通常会由一个或多个协同工作的团队来执行。因此,人工智能模型决策应该是可解释的,让IT团队能够更好地理解模型决策的意图,并采取相应的行动。
他指出,“人工智能模型最多可以达到80%到85%的准确度,因此这也有助于人类团队通过正确解释人工智能模型的决策来关联明智的决策。如果人工智能模型可以为其呈现的决策提供置信度评分,那么它也将有助于有效的工作负载管理。”
人工智能和机器学习开发商Tanjo公司联合创始人兼首席执行官Richard Boyd表示,随着人工智能和机器学习工具变得越来越普遍,很多企业认识到,当人类智能与技术合作而不是竞争时,可以实现最佳结果。他说,“机器在许多方面根本无法取代人类,但机器在某些领域的应用肯定比人类好得多。一旦人工智能和机器学习变得流行,并且企业员工适应这种新的合作关系,那么他们的观点就会发生转变。”
Dell科技公司的人工智能战略负责人Brons Larson表示,数据中心可以利用人工智能/机器学习来提高性能以及优化配置和部署。人工智能/机器学习支持动态协调资源与工作负载,以优化资源利用率以更好地管理成本。所有人工智能解决方案,无论是何种应用程序或供应商,都需要专业知识来正确配置和优化价值。这首先要正确捕获和评估用于训练和测试的数据,以及针对漂移和偏差管理部署的模型。
此外,基于规则的人工智能可以通过智能策略控制和预定义配置帮助自动化资源优化和合规性。Su指出,“使用从日常运营中收集的数据,基于机器学习的人工智能可以进一步增强数据中心运营的其他方面,这些方面以前需要深入的领域专业知识。例如,可以通过自学威胁检测和监控算法来加强数据中心的安全性。通过将所需资源引导到正确的方向,可以优化负载均衡、电源和冷却分配功能。”
Kavanaugh说,“人工智能还可以简化数据管理。企业越来越发现自己被与关键利益相关者有关的大量数据所包围。使用人工智能,企业可以确保有效、准确地管理这些大量数据。”在人工智能的帮助下,企业的IT团队可以比以往更快、更准确地执行数据质量分析或提取数据以创建预测等任务。他说,“这对企业来说至关重要,因为他们需要更准确的数据来做出明智的决策。”
人工智能软件包
随着人工智能的成熟,现在出现了一种软件驱动的方法,可以将不同的元素结合在一起,并将人工干预降至最低。例如,在典型的数据库系统中,需要大量配置才能使操作高效运行,例如索引表、跨服务器对数据进行分区、为某些类型的查询分配内存以及调整优化器以适应计算平台和预期的工作量。Howe指出,“人工智能可以通过从大量历史数据中学习规则和程序来提供帮助,关于哪些日程安排对哪些任务有效,而不是让我们试图弄清楚所有事情。”
有了人工智能,企业IT领导者和团队可以自由地专注于解决业务问题,而不必担心基础设施的细节。Belliappa说,“从人工智能的角度来看,我们使用的大多数模型都是自学习集成模型,它们结合使用各种技术,并在从它们管理的工作负载模式中学习时不断优化。”
规划和部署
在人工智能开始发挥其管理魔力之前,IT和业务领导者需要接受将关键管理职责移交给软件的想法。Shah说,“根据其规模和内部知识库,人工处理可能非常困难。”
最终,企业如何处理从人工到人工智能工作负载管理的过渡取决于其技术成熟度、运营规模和数据中心的活力。Kavanaugh说,“缺乏现代基础设施来有效利用其数据的孤立企业将陷入困境。”另一方面,越来越多的人工智能供应商提供针对特定类型企业的工具,这增加了几乎任何类型和规模的企业能够平稳过渡的可能性。他预测说,“随着企业及其解决方案的成熟,配置和部署的便利性将会继续提高,”
如果说人工智能有致命弱点的话,那就是该技术对数据中心系统和实践中甚至相对微妙变化的反应。Howe解释道,“大多数人工智能技术都是在假设固定环境的情况下寻找稳定的模式。如果以模型无法看到的方式改变环境,它会提供错误的答案。而在部署更改之前仔细规划可以帮助减轻这种担忧。”
人工智能得到更广泛的应用
虽然人工智能驱动的数据中心工作负载管理已经被许多大型企业使用,特别是谷歌、亚马逊和微软等超大规模企业,但规模较小的数据中心运营商直到现在才开始采用这项技术。Belliappa指出,用不了多久,数据中心管理人员将面临一个严峻的选择:或者继续依赖传统的数据中心管理技术和实践,或者大量投资于人工智能驱动的业务以保持活力。
从长远来看,随着技术的进步、成本的下降以及采用者信心的增强,人工智能驱动的管理有望成为主流。Shah预测说,“在接下来的四到六年内,人们将看到人工智能数据中心工作负载管理技术成为标准选项。”
Howe说,““我认为这种趋势正在迅速发展,随着数据中心自动化程度的提高,人工智能技术提供了一种更好的方法来利用提供商拥有大量数据的内容。”他预计使用人工智能学习方法的自动化工作负载管理将很快变得司空见惯。
Kavanaugh说,“越来越多的行业观察家认为人工智能将在未来三四年内的某个时候开始主导数据中心管理,尽管疫情的驱动可能有助于推动这一时间表向前推进。数据中心很快将能够实现几乎所有操作的自动化,从网络安全到维护再到监控。但是,随着数据量呈指数级增长,以及企业发现人工智能的新用途,数据中心管理人员的工作量及其管理将会继续增长。”