【业界】开源大势降低技术门槛,人工智能企业更依赖大数据

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

美国巴布森学院(Babson College)管理与信息科学学院的教授,MIT 院士,德勤资深研究员Thomas H. Davenport 最近有一个新发现:并不是所有想要使用人工智能的企业都会跟提供技术的公司合作。


为什么,因为有免费的开源算法可用。


靠销售AI软件来赚钱变得越来越难


Thomas以一家向他咨询的出版公司为例,这家公司希望能在产品的数据化和情景化中使用人工智能技术,但是,跟其他纷纷与IBM Watson合作的竞争对手不一样,这家出版公司并没有打算从IBM购买认知技术。


他们说:“我们认为AI软件的市场是迅速商品化的,我们能够以更低的成本来获得所需要的(AI)能力”。 


这家出版公司几位经验丰富的经理还提到,他们认为可以利用开源的人工智能软件来降低成本,现在可以选择的有好几种。另外,很多开放资源提供者并不是小企业,它们可都是谷歌、Facebook、微软和亚马逊这样的巨头。


Thomas说:“刚听到这样的观点时,我略微有一点意外。智能技术现在难道已经那么便宜,那么开放了吗?”


在一个已经变得相对更新的市场上,所谓的认知软件市场要怎样进行商品化?为什么深度学习和机器学习的开发者会进行开源?如果真的比不上免费的软件,Watson为什么可以为IBM带来100亿以上的收入。


首先,从为什么AI技术,也就是上文所说的认知技术为何会商品化这一方面,可以得到一些启示。


现在,软件开发中有一股强大的趋势——在向“微服务”发展,这种“微服务”在小型的功能块上处理运算,然后得到结果。这和传统的“API”或者应用程序交互界面的工作方式一样。由于这些都是小型的功能模块,比起大型的软件单元,企业更难为此付费。因为都是小型的和模块化的,所以这些企业会租用多个软件开发者开发的东西,而不是直接从大企业购买。


这几乎就是认知软件领域过去10多年所发生的事。现在开源库很多,其中不乏一些拥有通用认知功能的算法,比如神经网络、深度学习、语音解析和识别、图像识别等等。


一些库已经开源好几年了,谷歌、微软、Facebook和亚马逊都是最近一两年才开源。通常,通过这些开源库供应商的云平台,可以使用这些开源工具(这样一来,开源的公司至少还可以挣一点钱)。还有另一种方法,就是通过编程网站,比如Github来使用这些开源库。


理想的情况是,如果多家公司和大量的程序员都在使用某一家公司的开放资源认知工具,那么很有可能,软件将会变得标准化,另外,把这些工具嵌入到公司的其他产品中,也会变得更容易一些。


即便是为 IBM 带来丰厚收入的Watson也在走开源的道路。据统计,在Watson 开发者云上,现在有近20个API是可用的。另外,这个数字是不断变化的,因为会不断增加新的API、测试版会下架以及相关的API可能会被整合。


Thomas说,考虑到认知工具商品化的速度非常快,不久后,更多Watson的API进一步开源的话,我一点也不会觉得惊讶。


另一个驱动商品化的因素是“Bots”,也叫智能人机交互API,或聊天机器人,它通过文本或者声音的输入,允许人和程序间进行对话式的交流。Bot想要成功的话,首先要把语音转化成文本,然后分析分本,理解其含义。这听起来似乎很难,但是许多同类的公司已经发布了自己的Bot AI软件开放资源,并把Bot加入到了自己程序的交互中。很快,这一技术就会变得很普遍。由于Bot只是一个交互界面,一种像打字或者点击一样的东西,只不过更加容易一些罢了,所以没人会愿意在这个技术上花太多的钱。


以上这一切意味着,靠销售AI软件来赚钱会变得越来越难。当然,对于没有数据科学家的公司来说,会需要许多外部的建议。公司也需要去研究在自己的业务中哪些部分使用这些工具比较好。


Thomas说,我认为,会有一些高度定制化的AI解决方案,它们会是非常详细和具体的,并且通过开放资源就能获取。比如,能探测到欺诈的图像分析系统。


但是,总体上,拥有AI技术的软件会越来越多,而且都是免费的。如果你的公司知道做什么,怎么使用,或者怎样把其加入你的业务中,你就能挣钱。如果只是打算卖AI软件,收益可能就不会那么好了。


技术门槛降低,数据门槛变高


虽然算法的开源降低了技术门槛,但是在智能产品的开发中,只有算法是远远不够的。《财富》网站在7月11日一篇名为《为什么说数据是原油?》的报道中提到,只有拥有了数据,人工智能才会腾飞。


风险投资公司Bloomberg Beta的合伙人Shivon Zilis在评价的数据的价值时说:“数据是新的原油”。她认为,虽然谷歌、Facebook和亚马逊对人工智能软件进行了开源,任何工程师都可以获得代码并开发新的应用程序,但是,大公司并不会公开必需的数据。


谈到大公司开源软件的原因,她认为,这些公司正在通过开放AI软件工具包来招纳更多的人才。所以,如果真的要竞争,公司拥有的数据实际上比开源的软件更加重要。


IBM Watson 数据处理服务部门的总经理David Keeny说:“数据会成为主流。此外,现在全世界的数据,只有20%在互联网上,剩下的80%都被各大公司和组织占据。


谈到数据,希望在产品中加入人工智能技术的公司又分为两种,一种是有数据的,另一种是无数据的。有数据的是那些长久以来注重收集数据的老牌公司,比如医院;没有数据的通常是许多初创企业。


有数据的公司在智能化的道路上要走得容易一些,以自己手上的数据为资本,他们可以轻松地与拥有强大算法计算的公司达成合作,这种模式最典型的便是DeepMind与英国全民医疗体系(NHS)的合作,两家机构最新的技术成果是使用计算机视觉来诊断眼疾。


没有数据的初创企业也存在机会,那便是在“无数据问题”的环境,比如日程安排这些还没有公司取得巨大进展的问题处理上。


国外媒体Verge报道说,像X.ai这样的初创企业并没有谷歌在Gmail上累积的海量数据,但也开发出了智能化的日程安排软件,并获得商业的成功。 通过这一案例,Verge认为,初创企业可以聚焦于特别小的领域,比如X.ai关注日程安排的智能化。这是一个没有数据的人工智能企业取得突破的途径。


文章转自新智元公众号,原文链接

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
5天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
25 2
|
7天前
|
存储 分布式计算 NoSQL
【赵渝强老师】大数据技术的理论基础
本文介绍了大数据平台的核心思想,包括Google的三篇重要论文:Google文件系统(GFS)、MapReduce分布式计算模型和BigTable大表。这些论文奠定了大数据生态圈的技术基础,进而发展出了Hadoop、Spark和Flink等生态系统。文章详细解释了GFS的架构、MapReduce的计算过程以及BigTable的思想和HBase的实现。
|
3天前
|
机器学习/深度学习 人工智能 算法
探索人工智能与大数据的融合之道####
— 本文旨在探讨人工智能(AI)与大数据如何协同工作,以推动技术创新和产业升级。通过分析二者的基本概念、核心技术及应用场景,揭示它们相互促进的内在机制,并展望未来发展趋势。文章指出,AI提供了智能化处理数据的能力,而大数据则为AI提供了海量的训练资源,两者结合将开启无限可能。 ####
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与深度学习:探索未来技术的无限可能
在21世纪,人工智能(AI)和深度学习已经成为推动科技进步的重要力量。本文将深入探讨这两种技术的基本概念、发展历程以及它们如何共同塑造未来的科技景观。我们将分析人工智能的最新趋势,包括自然语言处理、计算机视觉和强化学习,并讨论这些技术在现实世界中的应用。此外,我们还将探讨深度学习的工作原理,包括神经网络、卷积神经网络(CNN)和循环神经网络(RNN),并分析这些模型如何帮助解决复杂的问题。通过本文,读者将对人工智能和深度学习有更深入的了解,并能够预见这些技术将如何继续影响我们的世界。
34 7
|
5天前
|
人工智能 自然语言处理 自动驾驶
技术与人性:探索人工智能伦理的边界####
本文深入探讨了人工智能技术飞速发展背景下,伴随而来的伦理挑战与社会责任。不同于传统摘要直接概述内容,本文摘要旨在引发读者对AI伦理问题的关注,通过提出而非解答的方式,激发对文章主题的兴趣。在智能机器逐渐融入人类生活的每一个角落时,我们如何确保技术的善意使用,保护个人隐私,避免偏见与歧视,成为亟待解决的关键议题。 ####
|
7天前
|
SQL 存储 算法
比 SQL 快出数量级的大数据计算技术
SQL 是大数据计算中最常用的工具,但在实际应用中,SQL 经常跑得很慢,浪费大量硬件资源。例如,某银行的反洗钱计算在 11 节点的 Vertica 集群上跑了 1.5 小时,而用 SPL 重写后,单机只需 26 秒。类似地,电商漏斗运算和时空碰撞任务在使用 SPL 后,性能也大幅提升。这是因为 SQL 无法写出低复杂度的算法,而 SPL 提供了更强大的数据类型和基础运算,能够实现高效计算。
|
10天前
|
存储 人工智能 分布式计算
大数据& AI 产品月刊【2024年10月】
大数据& AI 产品技术月刊【2024年10月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
10天前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
24 3
|
9天前
|
人工智能 算法 搜索推荐
探索人工智能与大数据的融合之道####
本文深入探讨了人工智能(AI)与大数据之间的紧密联系与相互促进的关系,揭示了二者如何共同推动科技进步与产业升级。在信息爆炸的时代背景下,大数据为AI提供了丰富的学习材料,而AI则赋予了大数据分析前所未有的深度与效率。通过具体案例分析,本文阐述了这一融合技术如何在医疗健康、智慧城市、金融科技等多个领域展现出巨大潜力,并对未来发展趋势进行了展望,强调了持续创新与伦理考量的重要性。 ####
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
探索人工智能与大数据的融合之美####
【10月更文挑战第29天】 身处信息技术飞速发展的时代,人工智能与大数据如同两颗璀璨的星辰,在科技的夜空中交相辉映,共同推动着社会进步与变革的浪潮。本文旨在揭开AI与大数据深度融合的神秘面纱,探讨这一融合如何引领技术前沿,激发创新活力,并展望其在未来世界中的无限可能。通过深入浅出的解析,展现技术背后的逻辑与魅力,邀请读者一同踏上这场科技与智慧的探索之旅。 ####
36 2