机器学习将非结构化二级存储数据变为可全局访问的数据

简介: 实现转型和变革的关键是数据,因为糟糕的数据会带来糟糕的洞察力,而良好的数据会带来良好的洞察力。对大多数组织来说,问题是他们可能有一个很好的主存储数据管理策略,但他们从二级存储中找到洞察的能力则通常是不存在的。

Cohesity的Helios可以将大量的二级存储从被浪费的资产转换成能够创造竞争优势的数据资产。

image.png

查尔斯•达尔文曾说:“能够活下来的物种,通常既非最强的物种,亦非最聪明的物种,而往往是最能适应改变的物种。”把这个公理用来形容当下的商业世界是再贴切不过的了。能否适应市场趋势一直是决定企业最终能成为市场领导者还是成为无关紧要者并最终被市场淘汰的决定因素。然而,在当今的数字时代,这些市场变化发生得要比以前更快,这给首席信息官带来了巨大压力,要求他们必须不断想办法在市场竞争中保持领先地位。


||  数据是揭示变革过程的关键


实现转型和变革的关键是数据,因为糟糕的数据会带来糟糕的洞察力,而良好的数据会带来良好的洞察力。对大多数组织来说,问题是他们可能有一个很好的主存储数据管理策略,但他们从二级存储中找到洞察的能力则通常是不存在的。从分支机构到本地服务器,二级存储的管理通常是一团乱麻。通常有多份数据的拷贝,但没有人知道哪一份才是真实的文件。所有的这些都会造成大量的存储碎片问题。


更大的挑战是,备用存储器往往占公司总存储器的90%。这意味着企业能够处理并获取洞察力的数据其实只占其整体数据的一小部分。二级存储大规模的碎片化一直是大多数组织无法解决的一个问题。


||  Cohesity使二级存储器具有全局可访问性


这就是Cohesity试图解决的问题。Cohesity是蓬勃发展的超融合(HCI)二级存储市场的先驱之一。Cohesity的DataPlatform是一种HCI解决方案,它将组织的所有二级存储合并到一个平台上,然后添加一些数据管理特性,以使工作流与DevOps保持一致,这正是当今许多组织内部正在不断发展的一项计划。我的研究表明,现在69%的企业对DevOps感兴趣,尽管并非所有的企业都将其应用在生产当中。而阻碍业务发展的挑战之一是DevOps经常与IT脱节。因而首席信息官需要在公司内部推动更好的一致性,数据方面的问题,特别是二级存储方面的问题是需要优先解决的问题之一。


||  Cohesity宣布推出Helios


本周,Cohesity发布了它的第一款软件即服务(SaaS)产品,名为Helios,它可以让客户更轻松地从一个仪表盘上管理和处理二级存储。更重要的是,客户可以使用Costopy提供的机器学习(ML)和分析工具来发现以往无法使用的数据洞察力。我相信ML将从根本上改变IT的基础设施管理,我也相信Cohesity是第一个将它应用到二级存储的厂商。


||  机器学习提高数据的可用性


Helios将来自全球部署的Cohesity集群的元数据聚合到其云中,并应用机器学习来让客户对存储做更多的事情。需要特别注意的是,对于具有安全意识的组织来说,这种一致性的获得并不是通过聚合数据本身,而是对象的元数据,后者将指向数据的位置。现在,存储管理员只需单击一下鼠标,就可以在多节点环境中全面的推出新策略或进行升级。其他功能包括:


•多集群管理,它为可见性、报告、可操作搜索、根源分析和故障排除提供了一个全局仪表板。


•一个“智能助理”,用来确保所需资源被正确引导到集群中以确保服务级别的协议得到满足。IT负责设置SLA,而智能助手负责合规性。


•利用Cohesity的ML能力的预构建托管应用程序。其中包括用于搜索数据字符串的模式查找器,例如社会安全号码或电话号码,以及用于查找不符合公司标准密码的密码检测,以及用于减少文件大小的视频压缩。


SaaS最大的且未被重视的好处之一是能够跨多个客户聚合并比较数据。在一个人的消费生活中,可以想想亚马逊提供的推荐,比如“买了X也买了Y的顾客”。Cohesity可以通过比较数据,了解其利用率、备份频率或其他的数据管理能力,然后做出适当的改变。


数字首席信息官们需要摒弃传统的存储思维,而更多地考虑数据的全球可访问性和优化。在ML时代,这一点将变得尤为重要,因为在这个时代,数据的质量可以决定你是市场领导者还是落后者。特别的,二级存储可能是当下公司中被浪费的最大的资源,如果能够利用在其中所获取的知识和见解,则可以帮助组织更快的实施他们的数字化转型工作。

相关文章
|
20天前
|
机器学习/深度学习 数据采集 数据处理
谷歌提出视觉记忆方法,让大模型训练数据更灵活
谷歌研究人员提出了一种名为“视觉记忆”的方法,结合了深度神经网络的表示能力和数据库的灵活性。该方法将图像分类任务分为图像相似性和搜索两部分,支持灵活添加和删除数据、可解释的决策机制以及大规模数据处理能力。实验结果显示,该方法在多个数据集上取得了优异的性能,如在ImageNet上实现88.5%的top-1准确率。尽管有依赖预训练模型等限制,但视觉记忆为深度学习提供了新的思路。
22 2
|
5月前
|
机器学习/深度学习 人工智能 专有云
人工智能平台PAI使用问题之怎么将DLC的数据写入到另一个阿里云主账号的OSS中
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
2月前
|
机器学习/深度学习 存储 人工智能
揭秘机器学习背后的神秘力量:如何高效收集数据,让AI更懂你?
【10月更文挑战第12天】在数据驱动的时代,机器学习广泛应用,从智能推荐到自动驾驶。本文以电商平台个性化推荐系统为例,探讨数据收集方法,包括明确数据需求、选择数据来源、编写代码自动化收集、数据清洗与预处理及特征工程,最终完成数据的训练集和测试集划分,为模型训练奠定基础。
52 3
|
2月前
|
机器学习/深度学习 算法 Python
“探秘机器学习的幕后英雄:梯度下降——如何在数据的海洋中寻找那枚失落的钥匙?”
【10月更文挑战第11天】梯度下降是机器学习和深度学习中的核心优化算法,用于最小化损失函数,找到最优参数。通过计算损失函数的梯度,算法沿着负梯度方向更新参数,逐步逼近最小值。常见的变种包括批量梯度下降、随机梯度下降和小批量梯度下降,各有优缺点。示例代码展示了如何用Python和NumPy实现简单的线性回归模型训练。掌握梯度下降有助于深入理解模型优化机制。
30 2
|
3月前
|
机器学习/深度学习 数据采集 监控
探索机器学习:从数据到决策
【9月更文挑战第18天】在这篇文章中,我们将一起踏上一段激动人心的旅程,穿越机器学习的世界。我们将探讨如何通过收集和处理数据,利用算法的力量来预测未来的趋势,并做出更加明智的决策。无论你是初学者还是有经验的开发者,这篇文章都将为你提供新的视角和思考方式。
|
2月前
|
机器学习/深度学习 算法 数据处理
EM算法对人脸数据降维(机器学习作业06)
本文介绍了使用EM算法对人脸数据进行降维的机器学习作业。首先通过加载ORL人脸数据库,然后分别应用SVD_PCA、MLE_PCA及EM_PCA三种方法实现数据降维,并输出降维后的数据形状。此作业展示了不同PCA变种在人脸数据处理中的应用效果。
35 0
|
3月前
|
机器学习/深度学习 数据采集 算法
利用未标记数据的半监督学习在模型训练中的效果评估
本文将介绍三种适用于不同类型数据和任务的半监督学习方法。我们还将在一个实际数据集上评估这些方法的性能,并与仅使用标记数据的基准进行比较。
238 8
|
2月前
|
机器学习/深度学习 算法 数据建模
【机器学习】类别不平衡数据的处理
【机器学习】类别不平衡数据的处理
|
4月前
|
监控 数据安全/隐私保护 异构计算
借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
【8月更文挑战第8天】借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
99 1
|
4月前
|
数据采集 机器学习/深度学习 算法
"揭秘数据质量自动化的秘密武器:机器学习模型如何精准捕捉数据中的‘隐形陷阱’,让你的数据分析无懈可击?"
【8月更文挑战第20天】随着大数据成为核心资源,数据质量直接影响机器学习模型的准确性和效果。传统的人工审查方法效率低且易错。本文介绍如何运用机器学习自动化评估数据质量,解决缺失值、异常值等问题,提升模型训练效率和预测准确性。通过Python和scikit-learn示例展示了异常值检测的过程,最后强调在自动化评估的同时结合人工审查的重要性。
100 2

热门文章

最新文章