【业界】开源大势降低技术门槛,人工智能企业更依赖大数据-阿里云开发者社区

开发者社区> 新智元> 正文

【业界】开源大势降低技术门槛,人工智能企业更依赖大数据

简介:

美国巴布森学院(Babson College)管理与信息科学学院的教授,MIT 院士,德勤资深研究员Thomas H. Davenport 最近有一个新发现:并不是所有想要使用人工智能的企业都会跟提供技术的公司合作。


为什么,因为有免费的开源算法可用。


靠销售AI软件来赚钱变得越来越难


Thomas以一家向他咨询的出版公司为例,这家公司希望能在产品的数据化和情景化中使用人工智能技术,但是,跟其他纷纷与IBM Watson合作的竞争对手不一样,这家出版公司并没有打算从IBM购买认知技术。


他们说:“我们认为AI软件的市场是迅速商品化的,我们能够以更低的成本来获得所需要的(AI)能力”。 


这家出版公司几位经验丰富的经理还提到,他们认为可以利用开源的人工智能软件来降低成本,现在可以选择的有好几种。另外,很多开放资源提供者并不是小企业,它们可都是谷歌、Facebook、微软和亚马逊这样的巨头。


Thomas说:“刚听到这样的观点时,我略微有一点意外。智能技术现在难道已经那么便宜,那么开放了吗?”


在一个已经变得相对更新的市场上,所谓的认知软件市场要怎样进行商品化?为什么深度学习和机器学习的开发者会进行开源?如果真的比不上免费的软件,Watson为什么可以为IBM带来100亿以上的收入。


首先,从为什么AI技术,也就是上文所说的认知技术为何会商品化这一方面,可以得到一些启示。


现在,软件开发中有一股强大的趋势——在向“微服务”发展,这种“微服务”在小型的功能块上处理运算,然后得到结果。这和传统的“API”或者应用程序交互界面的工作方式一样。由于这些都是小型的功能模块,比起大型的软件单元,企业更难为此付费。因为都是小型的和模块化的,所以这些企业会租用多个软件开发者开发的东西,而不是直接从大企业购买。


这几乎就是认知软件领域过去10多年所发生的事。现在开源库很多,其中不乏一些拥有通用认知功能的算法,比如神经网络、深度学习、语音解析和识别、图像识别等等。


一些库已经开源好几年了,谷歌、微软、Facebook和亚马逊都是最近一两年才开源。通常,通过这些开源库供应商的云平台,可以使用这些开源工具(这样一来,开源的公司至少还可以挣一点钱)。还有另一种方法,就是通过编程网站,比如Github来使用这些开源库。


理想的情况是,如果多家公司和大量的程序员都在使用某一家公司的开放资源认知工具,那么很有可能,软件将会变得标准化,另外,把这些工具嵌入到公司的其他产品中,也会变得更容易一些。


即便是为 IBM 带来丰厚收入的Watson也在走开源的道路。据统计,在Watson 开发者云上,现在有近20个API是可用的。另外,这个数字是不断变化的,因为会不断增加新的API、测试版会下架以及相关的API可能会被整合。


Thomas说,考虑到认知工具商品化的速度非常快,不久后,更多Watson的API进一步开源的话,我一点也不会觉得惊讶。


另一个驱动商品化的因素是“Bots”,也叫智能人机交互API,或聊天机器人,它通过文本或者声音的输入,允许人和程序间进行对话式的交流。Bot想要成功的话,首先要把语音转化成文本,然后分析分本,理解其含义。这听起来似乎很难,但是许多同类的公司已经发布了自己的Bot AI软件开放资源,并把Bot加入到了自己程序的交互中。很快,这一技术就会变得很普遍。由于Bot只是一个交互界面,一种像打字或者点击一样的东西,只不过更加容易一些罢了,所以没人会愿意在这个技术上花太多的钱。


以上这一切意味着,靠销售AI软件来赚钱会变得越来越难。当然,对于没有数据科学家的公司来说,会需要许多外部的建议。公司也需要去研究在自己的业务中哪些部分使用这些工具比较好。


Thomas说,我认为,会有一些高度定制化的AI解决方案,它们会是非常详细和具体的,并且通过开放资源就能获取。比如,能探测到欺诈的图像分析系统。


但是,总体上,拥有AI技术的软件会越来越多,而且都是免费的。如果你的公司知道做什么,怎么使用,或者怎样把其加入你的业务中,你就能挣钱。如果只是打算卖AI软件,收益可能就不会那么好了。


技术门槛降低,数据门槛变高


虽然算法的开源降低了技术门槛,但是在智能产品的开发中,只有算法是远远不够的。《财富》网站在7月11日一篇名为《为什么说数据是原油?》的报道中提到,只有拥有了数据,人工智能才会腾飞。


风险投资公司Bloomberg Beta的合伙人Shivon Zilis在评价的数据的价值时说:“数据是新的原油”。她认为,虽然谷歌、Facebook和亚马逊对人工智能软件进行了开源,任何工程师都可以获得代码并开发新的应用程序,但是,大公司并不会公开必需的数据。


谈到大公司开源软件的原因,她认为,这些公司正在通过开放AI软件工具包来招纳更多的人才。所以,如果真的要竞争,公司拥有的数据实际上比开源的软件更加重要。


IBM Watson 数据处理服务部门的总经理David Keeny说:“数据会成为主流。此外,现在全世界的数据,只有20%在互联网上,剩下的80%都被各大公司和组织占据。


谈到数据,希望在产品中加入人工智能技术的公司又分为两种,一种是有数据的,另一种是无数据的。有数据的是那些长久以来注重收集数据的老牌公司,比如医院;没有数据的通常是许多初创企业。


有数据的公司在智能化的道路上要走得容易一些,以自己手上的数据为资本,他们可以轻松地与拥有强大算法计算的公司达成合作,这种模式最典型的便是DeepMind与英国全民医疗体系(NHS)的合作,两家机构最新的技术成果是使用计算机视觉来诊断眼疾。


没有数据的初创企业也存在机会,那便是在“无数据问题”的环境,比如日程安排这些还没有公司取得巨大进展的问题处理上。


国外媒体Verge报道说,像X.ai这样的初创企业并没有谷歌在Gmail上累积的海量数据,但也开发出了智能化的日程安排软件,并获得商业的成功。 通过这一案例,Verge认为,初创企业可以聚焦于特别小的领域,比如X.ai关注日程安排的智能化。这是一个没有数据的人工智能企业取得突破的途径。


文章转自新智元公众号,原文链接

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
+ 订阅

官方博客
官网链接