人工智能如何提升大数据存储与管理效率？-阿里云开发者社区

人工智能如何提升大数据存储与管理效率？

2020-10-27 11626

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： 通过使用AI数据存储，供应商和企业可以将存储管理提升到一个新的水平。而且，存储管理员可以找到他们目前正在努力管理的指标的解决方案。

随着大数据的大量来源以及企业可用数据量的增加，存储容量规划已成为存储管理员的问题。据估计，每天产生2.5万亿字节的数据。现在，如果以神经元计算的话，那就是相当于2.5亿个人类大脑的海量数据。而且，相同的估计表明，全球总数据的90%是从2016年到2018年生成的。

可以简单地说，每天生成越来越多的数据，这正增加了存储工作负载的规模和复杂性。但是，人工智能可以拯救存储管理员，帮助他们高效地存储和管理数据。通过使用AI数据存储，供应商和企业可以将存储管理提升到一个新的水平。而且，存储管理员可以找到他们目前正在努力管理的指标的解决方案。

存储管理员需要努力的主要指标

存储管理员在管理存储问题时面临一些挑战。而且，如果他们克服了这些挑战，将帮助他们在数据存储的各个方面之间找到适当的平衡，例如在哪里分配工作负载，如何分配工作负载以及如何优化堆栈等等。

一般而言，吞吐量是指处理某事物的速率。在网络级别，吞吐量的度量单位是Mbps(兆位/秒)，而在存储级别，吞吐量的度量单位是MB /秒(兆字节/秒)。由于一个字节等于八兆位，因此生产率在存储级别上提高了。并且，变得难以管理提高的生产率。

1. 延时

延迟是服务器完成请求所花费的时间。关于存储，这是指满足单个存储块的请求所花费的时间。存储块或块存储是将数据存储在卷中的块。纯延迟不受吞吐量影响，但是如果单个块请求很大，则应用延迟可能会随着吞吐量的增加而偏离。

2. IOPS(每秒输入/输出操作)

IOPS是指存储堆栈每秒可以处理的离散读写任务的数量。存储堆栈是一种允许过程调用的数据结构。这意味着将多个过程彼此存储在堆栈中，然后在调用和返回的基础上一个接一个地执行所有过程。例如，如果一个过程被调用，它将被执行，然后返回，以便在堆栈中调用下一个过程。而且，在谈论IOPS时，基础输入/输出任务可以达到存储系统的堆栈限制。例如，读取一个大文件和多个小文件可能会对IOPS产生影响。由于读取单个大文件仅需要执行一个读取任务，因此可以以较高的速度执行它，而另一方面，读取多个文件的速度非常慢，因为需要执行许多读取任务。

AI数据存储如何解决存储问题

企业管理员和存储供应商处理各种各样的存储类型。而且，它们还满足不同输入/输出服务的指标。大型文件共享应用可能需要适当的吞吐量，但也必须允许延迟损失，因为大型而复杂的应用可能会对延迟产生不利影响。另一方面，电子邮件服务器可能需要大量存储，低延迟和良好的吞吐量，但它可能不需要非常苛刻的IOPS配置文件。并且，存储管理员应该决定应该为哪些存储分配什么资源。因此，在组织中运行着成千上万的服务时，对基础存储的管理超过了人们进行明智更改的能力。而且，这就是AI算法派上用场的地方。

人工智能支持的存储管理和计划

AI可以监控存储以检测多种工作负载的模式和性能。这里的工作负载是由各种输入/输出特征或应用任务生成的数据流。通过检测这些工作负载模式，AI可以帮助存储管理员洞悉哪些工作负载可能使他们面临最大化存储阵列的风险。此外，存储监视还可以帮助了解是否有任何额外的工作负载可以放入阵列中。而且，如果添加到阵列中，那么工作负载将造成多少中断。

例如，假设一家企业正在向流程中添加电子邮件服务器。在这种情况下，人工智能系统可以帮助预测存储阵列将能够满足该服务器的存储需求还是将其最大化。借助此类技术，存储管理员可以主动获取有关如何将不同的工作负载分配给不同的存储堆栈并最大程度地减少延迟的信息。因此，将AI集成到存储阵列，存储供应商和组织中可以优化存储堆栈。

除了监视存储活动外，存储管理员还需要检查和分析存储系统要使用的应用的编码和错误。这有助于他们更好地了解如何围绕应用的需求设计存储体系结构。他们通过了解应用的输入/输出模式来做到这一点。用于执行此操作的最常见技术是捕获应用的跟踪。

Strace是Linux的用户空间实用程序，可用于诊断、调试和获取有关输入和输出功能的指令。但是，由于复杂的应用可以具有多个输入/输出功能，因此这对人类来说可能是一个挑战。另一方面，ML算法可以轻松地提取和分析大量数据，并解决许多存储问题，最好是通过查看存储系统本身来解决。此外，通过使用大量数据训练算法，以了解特定堆栈或整个应用如何收集和存储数据，它们可以帮助实现对该特定应用存储活动的实时观察，以防止堆栈最大化并改善存储容量。

AI数据存储可满足客户需求

遥测数据是自动记录和无线传输来自远程或不可访问来源的数据。遥测以下列方式起作用：传感器在源处测量数据，它们将其转换为电压，然后将其与定时数据合并为单个数据流，该数据流将传输到远程接收器。接收后，可以根据用户要求对数据进行处理。

AI的计算机视觉技术可以扫描遥测数据，以保护存储阵列免受漏洞侵害。当使用有关漏洞的历史数据进行训练时，机器学习算法可以将来自各种应用程序的传入数据与历史数据进行匹配，以发现漏洞的可能性。因此，借助AI的预测分析，存储供应商可以着眼于在遇到客户之前防止存储问题。

AI数据存储仍处于起步阶段，但已经显示出了惊人的结果。而且，因此云供应商和其他存储管理员正在对AI进行越来越多的投资，以使用超融合存储系统进行存储维护。采用主流AI数据存储肯定会帮助企业控制上述所有指标，并为其客户提供更好的服务。

原文链接：https://ai.51cto.com/art/202010/629739.htm
本文转载自51CTO，本文一切观点和机器智能技术圈子无关。
在线免费体验百种AI能力：【点此跳转】

机器智能技术结尾二维码.png

人工智能如何提升大数据存储与管理效率？

机器智能技术

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

人工智能如何提升大数据存储与管理效率？

机器智能技术

热门文章

最新文章

相关课程

相关电子书

相关实验场景