AI格局正在从“数据”转变为“知识”

简介: 半个多世纪以前就引发了人工智能(AI)革命。在过去的十年中,人工智能已经从学术科学领域发展成为我们日常生活中不可或缺的一部分。我们看到的最常见的AI业务策略是围绕数据构建的。

戳这里免费开通百种视觉AI能力


半个多世纪以前就引发了人工智能(AI)革命。在过去的十年中,人工智能已经从学术科学领域发展成为我们日常生活中不可或缺的一部分。我们看到的最常见的AI业务策略是围绕数据构建的。我们认为专有数据是AI公司目前很具战略意义的护城河,但在未来几年中,专有数据将不再是一种独特的资产,从而使专有数据差异化的可持续性降低。因此,我们希望重点从基于数据的AI策略转向基于知识的AI策略。

image.png

大数据的进步得益于众多传感器的部署,互联网连接以及计算能力,通信能力和数字存储方面硬件和软件的改进,使AI能够从小型学术研究项目扩展到大型企业生产应用程序。本质上,大数据需要复杂的AI模型来分析和获取知识和见解,而AI模型则需要大量的大数据来进行培训和优化。。因此,目前,数据通常被认为是AI初创企业足够的战略护城河。作为风险投资人,我们经常会看到这种现象。近年来,我们看到许多初创公司将数据采集作为其业务战略的核心。越来越多的此类公司强调他们已获取的独特数据集以及获取其他专有数据的长期策略,将其作为可持续的进入壁垒。此外,由于AI工具和AI即服务平台已使AI模型的开发商品化,并且公共数据已无处不在,因此人们对于建立和捍卫数据护城河的需求已变得显而易见。

在当今的技术生态系统中,市场越来越多地通过领先的AI程序和对专有数据的控制来奖励公司,这是巨大而可持续的竞争优势。诸如Google和Netflix之类的公司已经在很长一段时间内开发并策划了海量且权威的数据集,而其他许多公司都在徒劳地努力以取得成功。一个例子是竞争对手的媒体服务提供商和制作公司的大规模破坏,而Netflix复杂的数据策略却无法解决这些问题。

不过,由于预期的数据交换能力和意愿的提高,我们相信十年之内,专有数据的护城河将不太可持续。尽管数据仍将为AI价值引擎提供动力,但AI业务战略将越来越侧重于知识。

image.png

将AI价值金字塔向知识层发展

AI价值金字塔基于数据并由知识驱动。今天,尽管“我们淹没在信息中,却渴望获取知识”,但我们期望将AI价值金字塔推向知识层。实际上,我们已经开始看到通过创建数据交换来促进和加速这一趋势的进步。我们希望增加可行性和愿意分享商品化数据以换取有价值的知识的结合将促进数据交换。总而言之,数据将变得更加丰富,可用,可靠,标准化且价格便宜,这是理想商品的完美定义。将来,将数据用作可持续的进入壁垒将变得更加困难。

通过物联网(IoT)的数据源激增将加速共享数据的可行性。此外,还有用于合并,共享和交换数据的新技术,协议和标准。展望未来,只要有动力和越来越大的意愿,共享数据的能力就会变得真正重要。随着AI破坏并破坏传统的竞争进入壁垒,许多组织不懈地尝试收集自己的专有数据并从中获利。las,这种数据的获取和利用既不容易也不富有成果,因此会造成战略上的不和谐。这是因为,尽管对于大多数组织来说,人工智能已变得越来越不可缺少,但它并不是其传统技能或核心专业知识的一部分。此外,经过AI培训的工程师,开发人员,产品负责人和经理的长期和长期短缺加剧了这种矛盾,并导致以知识交换为目标的数据共享解决方案偏爱。

通过交换数据以创造知识来创造能力和意愿的结合的一个例子是欧盟提出的新建议,即创建“单一数据市场”,以赋予人,企业和组织更好的决策权基于来自非个人数据的见解,以便与当前的科技巨头竞争。

导致数据护城河变得越来越不可持续的另一个因素是发明了新颖的数据解决方案,该解决方案能够使用较小的数据集进行训练。合成数据解决方案(例如,使用通用对抗网络)和其他最小化技术(如数据增强)可能使公司无需大量数据即可创建破坏性的AI产品。

image.png

建立知识策略

人工智能革命的未来将为企业带来新的现实,并将需要修订的业务战略。从数据到知识的转变将产生新颖的框架,合作伙伴关系和业务模型,其中包括为知识创造提供数据,信息,AI模型,存储和计算能力的不同参与者。由于传统数据护城河在未来十年将变得不那么可持续,并且知识将成为AI的真正价值驱动力,因此我们认为企业应该开始制定更侧重于知识的战略:

建立知识护城河而不是数据护城河是一项基本原则,应该成为未来业务战略的核心。公司和组织应该开始为以知识为中心的时代做准备,在这个时代,赢家将是那些提出正确问题,寻找最相关的预测并设计很具破坏性的基于AI的应用程序的人。
自上而下使用AI并围绕应用程序和产品层组织业务。模型应基于特定的垂直和假设进行开发和训练。例如,在成像,诊断,远程医疗,药理学和其他临床应用中开发特定的医疗保健应用;或在车队管理,公共交通及其他方面的流动性。这些解决方案的开发将基于特定领域的丰富知识和实践经验,结合上下文知识和适当且经过良好调整的模型。
数据获取计划应仅被视为短期的战术追求,而基于知识的交流与合作伙伴关系则应作为长期的业务战略加以培养。一个富有成效的例子是,去年,以色列创新局启动了一项试点计划,以实现医院与技术初创企业之间基于知识的合作。这种合作在初创企业的医院之间产生了数十项计划[12] ,并促进了医院之间以及医院之间的原始(和几乎未使用的)数据交换,以及初创企业产生的新颖而有价值的知识。
最后,向知识的转变也应该影响组织的人力资源战略。公司应为AI的未来制定相关且明智的人力资源战略。尽管一些初创企业仍需要聘用大量稀有和昂贵的数据工程师和科学家,但应将精明的公司的AI团队设计为一个管理团队,旨在追求和促进AI知识合作伙伴关系,发明基于AI的应用程序和产品并创造性地探索AI革命的美好前景-从以数据为中心到以知识为中心进行了重新构想。此外,AI团队应该让人们了解他们所操作领域的上下文。这些上下文团队成员应该包含一种整体方法,这种方法源于他们对AI和特定领域的理解,而不仅仅是一般AI专家。
总体而言,人工智能的未来取决于从强调专有数据集转向跨实体共享数据以创建知识。为了实施成功的AI战略,公司必须正确地组合数据,信息,AI模型,存储,计算能力等,以使业务扎根于知识。


原文链接:https://ai.51cto.com/art/202011/631005.htm
本文转自51CTO,本文一切观点和机器智能技术圈子无关。
在线免费体验百种AI能力:【点此跳转】
机器智能技术结尾二维码.png

目录
相关文章
|
2月前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
2月前
|
人工智能 关系型数据库 分布式数据库
拥抱Data+AI|“全球第一”雅迪如何实现智能营销?DMS+PolarDB注入数据新活力
针对雅迪“云销通App”的需求与痛点,本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案,助力销售人员高效用数,全面提升销售管理效率。
|
2月前
|
机器学习/深度学习 人工智能 算法
整合海量公共数据,谷歌开源AI统计学专家DataGemma
【10月更文挑战第28天】谷歌近期开源了DataGemma,一款AI统计学专家工具,旨在帮助用户轻松整合和利用海量公共数据。DataGemma不仅提供便捷的数据访问和处理功能,还具备强大的数据分析能力,支持描述性统计、回归分析和聚类分析等。其开源性质和广泛的数据来源使其成为AI研究和应用的重要工具,有助于加速研究进展和推动数据共享。
75 6
|
9天前
|
人工智能 安全 DataX
【瓴羊数据荟】 Data x AI :大模型时代的数据治理创新实践 | 瓴羊数据Meet Up城市行第三期
第三期瓴羊数据Meetup 将于2025年1月3日在线上与大家见面,共同探讨AI时代的数据治理实践。
61 10
【瓴羊数据荟】 Data x  AI :大模型时代的数据治理创新实践 | 瓴羊数据Meet Up城市行第三期
|
9天前
|
存储 人工智能 人机交互
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
PC Agent 是上海交通大学与 GAIR 实验室联合推出的智能 AI 系统,能够模拟人类认知过程,自动化执行复杂的数字任务,如组织研究材料、起草报告等,展现了卓越的数据效率和实际应用潜力。
84 1
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
|
2天前
|
存储 数据采集 算法
构建AI数据管道:从数据到洞察的高效之旅最佳实践
本文探讨了大模型从数据处理、模型训练到推理的全流程解决方案,特别强调数据、算法和算力三大要素。在数据处理方面,介绍了多模态数据的高效清洗与存储优化;模型训练中,重点解决了大规模数据集和CheckPoint的高效管理;推理部分则通过P2P分布式加载等技术提升效率。案例展示了如何在云平台上实现高性能、低成本的数据处理与模型训练,确保业务场景下的最优表现。
|
27天前
|
存储 机器学习/深度学习 人工智能
【AI系统】完全分片数据并行 FSDP
本文深入探讨了AI框架中针对权重数据、优化器数据和梯度数据的分布式并行实现,特别是在PyTorch框架下的具体方案。文章首先回顾了通用数据并行和分布式数据并行的概念,重点讨论了同步与异步数据并行的差异。接着,文章详细介绍了如何在PyTorch中实现弹性数据并行,特别是完全分片数据并行(FSDP)的机制,包括其如何通过分片模型状态和剩余状态来减少内存消耗,提高训练效率。此外,文章还探讨了混合精度训练、损失缩放和内存消耗估算等关键技术,为理解和实施高效的分布式训练提供了全面的指导。
61 9
【AI系统】完全分片数据并行 FSDP
|
27天前
|
机器学习/深度学习 人工智能 PyTorch
【AI系统】数据并行
数据并行是一种在分布式AI系统中广泛应用的技术,通过将数据集划分成多个子集并在不同计算节点上并行处理,以提高计算效率和速度。在大规模机器学习和深度学习训练中,数据并行可以显著加快模型训练速度,减少训练时间,提升模型性能。每个计算节点接收完整的模型副本,但处理不同的数据子集,从而分摊计算任务,提高处理速度和效率。数据并行按同步方式可分为同步数据并行和异步数据并行,按实现方式包括数据并行、分布式数据并行、完全分片的数据并行等。其中,分布式数据并行(DDP)是当前应用最广泛的并行算法之一,通过高效的梯度聚合和参数同步机制,确保模型一致性,适用于大型NPU集群和AI系统。
98 7
【AI系统】数据并行
|
4天前
|
人工智能 Cloud Native 数据管理
数据+AI融合趋势洞察暨阿里云OpenLake解决方案发布
Forrester是全球领先的市场研究与咨询机构,专注于新兴技术在各领域的应用。本文探讨如何加速现代数据管理,推动人工智能与客户业务的融合创新。面对数据标准缺乏、多云环境复杂性、新兴业务场景及过多数据平台等挑战,Forrester提出构建AI就绪的数据管理基石,通过互联智能框架、全局数据管理和DataOps、端到端数据管理能力、AI赋能的数据管理以及用例驱动的策略,帮助企业实现数据和AI的深度融合,提升业务价值并降低管理成本。
|
2月前
|
人工智能 算法 BI
聚焦AI与BI融合,引领数智化新潮流 | 【瓴羊数据荟】瓴羊数据Meet Up城市行第一站完美收官!
当BI遇见AI,洞见变得触手可及 —— 瓴羊「数据荟」数据Meet Up城市行·杭州站启幕,欢迎参与。
433 5
聚焦AI与BI融合,引领数智化新潮流 | 【瓴羊数据荟】瓴羊数据Meet Up城市行第一站完美收官!