机器学习将非结构化二级存储数据变为可全局访问的数据

简介: 实现转型和变革的关键是数据,因为糟糕的数据会带来糟糕的洞察力,而良好的数据会带来良好的洞察力。对大多数组织来说,问题是他们可能有一个很好的主存储数据管理策略,但他们从二级存储中找到洞察的能力则通常是不存在的。

Cohesity的Helios可以将大量的二级存储从被浪费的资产转换成能够创造竞争优势的数据资产。

image.png

查尔斯•达尔文曾说:“能够活下来的物种,通常既非最强的物种,亦非最聪明的物种,而往往是最能适应改变的物种。”把这个公理用来形容当下的商业世界是再贴切不过的了。能否适应市场趋势一直是决定企业最终能成为市场领导者还是成为无关紧要者并最终被市场淘汰的决定因素。然而,在当今的数字时代,这些市场变化发生得要比以前更快,这给首席信息官带来了巨大压力,要求他们必须不断想办法在市场竞争中保持领先地位。


||  数据是揭示变革过程的关键


实现转型和变革的关键是数据,因为糟糕的数据会带来糟糕的洞察力,而良好的数据会带来良好的洞察力。对大多数组织来说,问题是他们可能有一个很好的主存储数据管理策略,但他们从二级存储中找到洞察的能力则通常是不存在的。从分支机构到本地服务器,二级存储的管理通常是一团乱麻。通常有多份数据的拷贝,但没有人知道哪一份才是真实的文件。所有的这些都会造成大量的存储碎片问题。


更大的挑战是,备用存储器往往占公司总存储器的90%。这意味着企业能够处理并获取洞察力的数据其实只占其整体数据的一小部分。二级存储大规模的碎片化一直是大多数组织无法解决的一个问题。


||  Cohesity使二级存储器具有全局可访问性


这就是Cohesity试图解决的问题。Cohesity是蓬勃发展的超融合(HCI)二级存储市场的先驱之一。Cohesity的DataPlatform是一种HCI解决方案,它将组织的所有二级存储合并到一个平台上,然后添加一些数据管理特性,以使工作流与DevOps保持一致,这正是当今许多组织内部正在不断发展的一项计划。我的研究表明,现在69%的企业对DevOps感兴趣,尽管并非所有的企业都将其应用在生产当中。而阻碍业务发展的挑战之一是DevOps经常与IT脱节。因而首席信息官需要在公司内部推动更好的一致性,数据方面的问题,特别是二级存储方面的问题是需要优先解决的问题之一。


||  Cohesity宣布推出Helios


本周,Cohesity发布了它的第一款软件即服务(SaaS)产品,名为Helios,它可以让客户更轻松地从一个仪表盘上管理和处理二级存储。更重要的是,客户可以使用Costopy提供的机器学习(ML)和分析工具来发现以往无法使用的数据洞察力。我相信ML将从根本上改变IT的基础设施管理,我也相信Cohesity是第一个将它应用到二级存储的厂商。


||  机器学习提高数据的可用性


Helios将来自全球部署的Cohesity集群的元数据聚合到其云中,并应用机器学习来让客户对存储做更多的事情。需要特别注意的是,对于具有安全意识的组织来说,这种一致性的获得并不是通过聚合数据本身,而是对象的元数据,后者将指向数据的位置。现在,存储管理员只需单击一下鼠标,就可以在多节点环境中全面的推出新策略或进行升级。其他功能包括:


•多集群管理,它为可见性、报告、可操作搜索、根源分析和故障排除提供了一个全局仪表板。


•一个“智能助理”,用来确保所需资源被正确引导到集群中以确保服务级别的协议得到满足。IT负责设置SLA,而智能助手负责合规性。


•利用Cohesity的ML能力的预构建托管应用程序。其中包括用于搜索数据字符串的模式查找器,例如社会安全号码或电话号码,以及用于查找不符合公司标准密码的密码检测,以及用于减少文件大小的视频压缩。


SaaS最大的且未被重视的好处之一是能够跨多个客户聚合并比较数据。在一个人的消费生活中,可以想想亚马逊提供的推荐,比如“买了X也买了Y的顾客”。Cohesity可以通过比较数据,了解其利用率、备份频率或其他的数据管理能力,然后做出适当的改变。


数字首席信息官们需要摒弃传统的存储思维,而更多地考虑数据的全球可访问性和优化。在ML时代,这一点将变得尤为重要,因为在这个时代,数据的质量可以决定你是市场领导者还是落后者。特别的,二级存储可能是当下公司中被浪费的最大的资源,如果能够利用在其中所获取的知识和见解,则可以帮助组织更快的实施他们的数字化转型工作。

相关文章
|
1天前
|
数据采集 机器学习/深度学习 人工智能
【机器学习】在使用K-means算法之前,如何预处理数据?
【5月更文挑战第12天】【机器学习】在使用K-means算法之前,如何预处理数据?
|
4天前
|
机器学习/深度学习
【机器学习】噪声数据对贝叶斯模型有什么样的影响?
【5月更文挑战第10天】【机器学习】噪声数据对贝叶斯模型有什么样的影响?
|
8天前
|
机器学习/深度学习 数据采集 算法
数据分享|R语言机器学习预测案例合集:众筹平台、机票折扣、糖尿病患者、员工满意度
数据分享|R语言机器学习预测案例合集:众筹平台、机票折扣、糖尿病患者、员工满意度
|
9天前
|
数据采集
【大模型】大语言模型训练数据中的偏差概念及其可能的影响?
【5月更文挑战第5天】【大模型】大语言模型训练数据中的偏差概念及其可能的影响?
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
【5月更文挑战第4天】【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
|
14天前
|
机器学习/深度学习 存储 数据采集
【Python 机器学习专栏】PCA(主成分分析)在数据降维中的应用
【4月更文挑战第30天】本文探讨了主成分分析(PCA)在高维数据降维中的应用。PCA通过线性变换找到最大化方差的主成分,从而降低数据维度,简化存储和计算,同时去除噪声。文章介绍了PCA的基本原理、步骤,强调了PCA在数据降维、可视化和特征提取上的优势,并提供了Python实现示例。PCA广泛应用在图像压缩、机器学习和数据分析等领域,但降维后可能损失解释性,需注意选择合适主成分数量及数据预处理。
|
14天前
|
机器学习/深度学习 Python
【Python机器学习专栏】时间序列数据的特征工程
【4月更文挑战第30天】本文探讨了时间序列数据的特征工程,强调其在捕捉季节性、揭示趋势、处理异常值和提升模型性能中的重要性。介绍了滞后特征、移动窗口统计特征、时间戳特征、频域特征和波动率特征等方法,并提供了Python实现示例。通过有效特征工程,可提高时间序列分析的准确性和预测可靠性。
|
14天前
|
机器学习/深度学习 计算机视觉 Python
【Python 机器学习专栏】图像数据的特征提取与预处理
【4月更文挑战第30天】本文探讨了图像数据的特征提取与预处理在机器学习中的重要性。图像数据具有大容量、信息丰富和冗余性高的特点。特征提取涉及颜色、纹理和形状特征;预处理包括图像增强、去噪和分割。Python的OpenCV和Scikit-image库在处理这些任务时非常有用。常见的特征提取方法有统计、变换和基于模型的方法,而预处理应注意保持图像真实性、适应性调整及验证评估。有效的特征提取和预处理能提升模型性能,Python工具使其更高效。
|
14天前
|
机器学习/深度学习 自然语言处理 算法
【Python机器学习专栏】文本数据的特征提取与表示
【4月更文挑战第30天】本文探讨了文本特征提取与表示在机器学习和NLP中的重要性。介绍了词袋模型、TF-IDF和n-gram等特征提取方法,以及稀疏向量和词嵌入等表示方式。Python中可利用sklearn和gensim库实现这些技术。有效的特征提取与表示有助于将文本数据转化为可处理的数值形式,推动NLP和机器学习领域的进步。
|
14天前
|
机器学习/深度学习 数据采集 算法
【Python机器学习专栏】使用Scikit-learn进行数据编码
【4月更文挑战第30天】本文介绍了Python Scikit-learn库在机器学习数据预处理中的作用,尤其是数据编码。数据编码将原始数据转化为算法可理解的格式,包括标签编码(适用于有序分类变量)、独热编码(适用于无序分类变量)和文本编码(如词袋模型、TF-IDF)。Scikit-learn提供LabelEncoder和OneHotEncoder类实现这些编码。示例展示了如何对数据进行标签编码和独热编码,强调了正确选择编码方法的重要性。