搜狗CTO杨洪涛：该以什么样的姿势参与人工智能-阿里云开发者社区

搜狗CTO杨洪涛：该以什么样的姿势参与人工智能

2018-05-22 1508

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

6月28日，2016网易未来科技峰会在北京国贸大酒店举行，搜狗CTO杨洪涛进行了主题演讲——《人工智能里的产品观》。杨洪涛认为：“人工智能本身并不创造价值，使用AI技术的好产品才创造价值。以场景思考产品，回归用户欲望，通过技术手段解决才有可能产生出好产品。”

“计算力+数据+服务”是三大核心要素

杨洪涛讲道，机器学习与深度学习在应用角度的两大要素如今已经较为成熟。一方面是计算力，伴随着CPU、GPU，以及各种分布式计算和专用计算平台的发展，这在一定程度上保障了计算力的提升；另一方面，移动互联网的发展带来了大量的数据，而对于互联网产品提供商来说，其接触到的数以亿计的用户，以及用户生产的庞大数据更是助力人工智能的丰厚资源。

然而当谈到产品化，要让“计算力+数据”的闭环做得更好，“服务”就成了一个不可忽视，且至关重要的元素。杨洪涛表示：“正是在服务的使用之中，用户才产生了数据，而数据又在消耗着计算力，对计算力的发展提出更高要求，从而为用户带来更好地体验。用户体验的提升则逆向推动用户使用服务，从而产生更多的数据。因此，计算力+数据+服务是一个产品迭代的完整循环。”

他还提到，现在许多公司把目光局限于技术这一单一领域，他们将自身定位为“一家人工智能公司”或“一家机器人公司”，却忽视了对于如何参与这一行业的深入思考。对于技术本身的关注不可或缺，却不是唯一。

好产品要能生产数据来完成自我进化

除了关注AI技术，更重要的是关注用户场景。只有在用户场景背景下，深度思考用户需求的产品，才能通过“计算力+数据+服务”的闭环，促使用户使用，生产更多数据，从而推动技术产品进步——谷歌的Google Now以及苹果Siri的升级与演进都是如此。

杨洪涛以搜狗输入法在语音识别方面的探索经验为例。众所周知，输入法只有文本输入一种方式是远远不够的，语音输入成为搜狗输入法发展历程上亟待解决的一大问题，而在2012年的时候，搜狗还没有这项技术。那么搜狗是怎样解决这一问题的？先是调用Google国外的中文语音识别接口，为产品提供语音转写功能，随后又在用户使用过程中不断积攒数据，并随着语料规模的不断扩充，逐步降低语音识别的错误率，从2012年40%的错误率到如今的4%，其中产品发展至关重要的一点就在于是否能产生迭代数据的循环。

基于这一案例，杨洪涛总结：“人工智能本身并不创造价值，使用AI技术的好产品才创造价值。MIT人工智能实验室前主管、计算机科学家Patrick Winston说过，人工智能就像葡萄干面包里的葡萄干。其实想要吃饱主要还是靠面包，技术并不等于产品，同时还要去思考产品对用户的服务是什么。”

那么什么样的产品才叫做好产品呢？杨洪涛给出了好产品的三大评判标准：叫好、卖座、赚钱。叫好的产品能获取媒体、投资人的关注，从而得到更多产品开发资源；卖座的产品能获取用户，展开未来的发展想象力；赚钱的产品则能直接为企业发展赢得利润。

对用户欲望的思考要先于技术手段

有了对于好产品的判断标准之后又该如何做出一个好产品？杨洪涛指出，需要回到对用户场景的思考，即需要去考虑是在什么时间什么地点，用户产生了什么欲望？在用户欲望产生之后，才是该以怎样的技术手段来满足用户的欲望。欲望是排在手段之前的，如果颠倒顺序，先看自己手里有什么技术就会犯错误。

他再次以搜狗输入法做语音识别功能为例，解释了该服务背后用户真正的欲望是解放双手。目前，搜狗语音识别的准确率已达到97%，在行业内位列前茅，每日的语音调用次数也达到了1.2亿次。但是即便语音识别的准确率达到了97%左右也仍旧会产生错误，这时用户要进行修改就还需要用手，而这对双手的解放就是不够彻底的。搜狗输入法近期做的新功能“语音修改”，让用户用自然语言的形式进行文字纠错，就是出于这一对使用场景的思考。

这一场景的数据还可以延伸到更多服务：比如当用户开车时，是不方便输入文字的。而通过语音的方式可以让用户在地图产品中用语音进行修改，比如说出“是欢度佳节的佳”就可以把导航目标从“世纪嘉园”修正成“世纪佳园”。

这一功能是符合前面提到的数据生成和解决用户欲望的观点的。“要修改错误，首先需要知道用户的错误发生在什么地方，其次要了解用户是怎样认知和描述这一错误的。这两类数据对输入法和语音识别未来的改进都有相当的促进作用。”杨洪涛总结道。

AI服务的本质是“自然交互”和“知识索引”

对此杨洪涛以开车用户的需求为例进行了详细的解释。传统意义上，导航仅仅解决了“如何从a地前往b地”的问题，而当回归对于用户欲望的思考时就会发现在使用导航时，用户并不只是为了前往B地，其真正的意图在于“去B地做什么”。比如一个人要去机场，这个人是要去哪个航站楼？到底是去出发层还是到达层？航班的情况如何？什么时间到最合适？这些问题都是用户潜在需要考虑的。因此需要对导航背后意图数据做足够的分析，把首都机场分为T1、T2、T3航站楼，导入所有的航班信息，当用户给出航班号便可以得知航班的情况，对应出发和到达，并给出出发时间建议，把这些和语义技术结合在一起做出更好的服务。

他指出AI服务的本质包含两方面，第一是自然交互的技术，包括图像及语音，第二是知识的索引。他坦言，搜狗目前也在这两方面做出了巨大的努力：一方面在自然交互上，搜狗通过用户产生的大量数据不断完善语音识别、语义理解技术；另一方面，搜狗搜索也在做大量的知识索引，包括与微信、知乎的内容引入，明医搜索以及微软必应的合作等。今年4月，搜狗还向清华大学捐赠1.8亿人民币，成立了天工智能计算研究院，相关研究成果也将应用于搜狗下一代产品中。

在他看来，搜索引擎公司是人工智能基因最足的模式，天生就是大数据产品，容易获得用户交互的行为，所以数据本身对于推动整个人工智能研究会有巨大的帮助。只有把人工智能技术与领域的知识结合得足够好，才能够真正的在场景下解决好用户的需求欲望。

本文出处：畅享网

本文来自云栖社区合作伙伴畅享网，了解相关信息可以关注vsharing.com网站。

搜狗CTO杨洪涛：该以什么样的姿势参与人工智能

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

搜狗CTO杨洪涛：该以什么样的姿势参与人工智能

热门文章

最新文章

相关课程

相关电子书

相关实验场景