数字化转型浪潮促使许多企业开始加大对AI项目的投资,随着转型过程的深入,越来越多的人发现,们原本管理数据的方式需要从根本上改变。
IT团队一直将数据作为创建数据的应用程序的扩展来管理,这种方法导致出现了大量的数据孤岛。更糟糕的是,经常出现数据冲突问题。因为不同应用程序可能以不同方式呈现同一个公司名称,或者根本没有更新最新的交易数据。
然而,组织创建的AI模型需要大量准确的数据才能进行适当的训练。这一要求促使组织在云计算平台上创建巨大的数据湖,以便被多个AI模型轻松访问。随着越来越多的数据被添加到数据湖中,构成AI模型的机器学习算法也在不断更新。
然而,许多组织管理数据的流程和系统有些过时,IT 团队开始采用DataOps跨平台管理数据。DataOps在概念上类似于企业为简化应用开发而采用的最佳DevOps实践,其目标是尽快减少数据管理的问题。
各个数据存储系统供应商都在推出新的平台,让在本地和公共云上的数据湖之间自动移动数据变得更加简单。
例如,联想开发出联想ThinkSystem DM5100F产品,包括对基于S3应用程序编程接口(API)的对象存储的支持。S3 API最初由Amazon Web Services开发,现已成为访问基于对象存储系统的云存储服务的事实标准。联想数据中心集团副总裁Kamran Amini表示:“IT团队仍然可以将数据存储为文件或本地存储块,但S3将减少数据移入和移出公共云时的问题。”Kamran Amini表示:“数据管理是一个关键部分,因为我们要考虑如何为企业客户提供服务,并能够在AI和数据分析方面发挥领导作用。”
如果数据是推动数字业务转型的新石油,那么将石油变成燃料的方式需要改变。AI与其他形式的高级分析相结合,只有在数据可访问的情况下才是可靠的。如果不更加严格地管理数据,AI的投资回报最多也只能是次优的。在某些情况下,它甚至可能变成灾难性,因为比犯错更糟糕的事情是大规模的错误。
事实上,由于现在企业管理数据的方式非常重要,数据管理现代化的需求从未像现在这样迫切。