搜狗CTO杨洪涛:该以什么样的姿势参与人工智能

简介:

6月28日,2016网易未来科技峰会在北京国贸大酒店举行,搜狗CTO杨洪涛进行了主题演讲——《人工智能里的产品观》。杨洪涛认为:“人工智能本身并不创造价值,使用AI技术的好产品才创造价值。以场景思考产品,回归用户欲望,通过技术手段解决才有可能产生出好产品。”


“计算力+数据+服务”是三大核心要素

杨洪涛讲道,机器学习与深度学习在应用角度的两大要素如今已经较为成熟。一方面是计算力,伴随着CPU、GPU,以及各种分布式计算和专用计算平台的发展,这在一定程度上保障了计算力的提升;另一方面,移动互联网的发展带来了大量的数据,而对于互联网产品提供商来说,其接触到的数以亿计的用户,以及用户生产的庞大数据更是助力人工智能的丰厚资源。

然而当谈到产品化,要让“计算力+数据”的闭环做得更好,“服务”就成了一个不可忽视,且至关重要的元素。杨洪涛表示:“正是在服务的使用之中,用户才产生了数据,而数据又在消耗着计算力,对计算力的发展提出更高要求,从而为用户带来更好地体验。用户体验的提升则逆向推动用户使用服务,从而产生更多的数据。因此,计算力+数据+服务是一个产品迭代的完整循环。”

他还提到,现在许多公司把目光局限于技术这一单一领域,他们将自身定位为“一家人工智能公司”或“一家机器人公司”,却忽视了对于如何参与这一行业的深入思考。对于技术本身的关注不可或缺,却不是唯一。

好产品要能生产数据来完成自我进化

除了关注AI技术,更重要的是关注用户场景。只有在用户场景背景下,深度思考用户需求的产品,才能通过“计算力+数据+服务”的闭环,促使用户使用,生产更多数据,从而推动技术产品进步——谷歌的Google Now以及苹果Siri的升级与演进都是如此。

杨洪涛以搜狗输入法在语音识别方面的探索经验为例。众所周知,输入法只有文本输入一种方式是远远不够的,语音输入成为搜狗输入法发展历程上亟待解决的一大问题,而在2012年的时候,搜狗还没有这项技术。那么搜狗是怎样解决这一问题的?先是调用Google国外的中文语音识别接口,为产品提供语音转写功能,随后又在用户使用过程中不断积攒数据,并随着语料规模的不断扩充,逐步降低语音识别的错误率,从2012年40%的错误率到如今的4%,其中产品发展至关重要的一点就在于是否能产生迭代数据的循环。

基于这一案例,杨洪涛总结:“人工智能本身并不创造价值,使用AI技术的好产品才创造价值。MIT人工智能实验室前主管、计算机科学家Patrick Winston说过,人工智能就像葡萄干面包里的葡萄干。其实想要吃饱主要还是靠面包,技术并不等于产品,同时还要去思考产品对用户的服务是什么。”

那么什么样的产品才叫做好产品呢?杨洪涛给出了好产品的三大评判标准:叫好、卖座、赚钱。叫好的产品能获取媒体、投资人的关注,从而得到更多产品开发资源;卖座的产品能获取用户,展开未来的发展想象力;赚钱的产品则能直接为企业发展赢得利润。

对用户欲望的思考要先于技术手段

有了对于好产品的判断标准之后又该如何做出一个好产品?杨洪涛指出,需要回到对用户场景的思考,即需要去考虑是在什么时间什么地点,用户产生了什么欲望?在用户欲望产生之后,才是该以怎样的技术手段来满足用户的欲望。欲望是排在手段之前的,如果颠倒顺序,先看自己手里有什么技术就会犯错误。

他再次以搜狗输入法做语音识别功能为例,解释了该服务背后用户真正的欲望是解放双手。目前,搜狗语音识别的准确率已达到97%,在行业内位列前茅,每日的语音调用次数也达到了1.2亿次。但是即便语音识别的准确率达到了97%左右也仍旧会产生错误,这时用户要进行修改就还需要用手,而这对双手的解放就是不够彻底的。搜狗输入法近期做的新功能“语音修改”,让用户用自然语言的形式进行文字纠错,就是出于这一对使用场景的思考。

这一场景的数据还可以延伸到更多服务:比如当用户开车时,是不方便输入文字的。而通过语音的方式可以让用户在地图产品中用语音进行修改,比如说出“是欢度佳节的佳”就可以把导航目标从“世纪嘉园”修正成“世纪佳园”。

这一功能是符合前面提到的数据生成和解决用户欲望的观点的。“要修改错误,首先需要知道用户的错误发生在什么地方,其次要了解用户是怎样认知和描述这一错误的。这两类数据对输入法和语音识别未来的改进都有相当的促进作用。”杨洪涛总结道。

AI服务的本质是“自然交互”和“知识索引”

对此杨洪涛以开车用户的需求为例进行了详细的解释。传统意义上,导航仅仅解决了“如何从a地前往b地”的问题,而当回归对于用户欲望的思考时就会发现在使用导航时,用户并不只是为了前往B地,其真正的意图在于“去B地做什么”。比如一个人要去机场,这个人是要去哪个航站楼?到底是去出发层还是到达层?航班的情况如何?什么时间到最合适?这些问题都是用户潜在需要考虑的。因此需要对导航背后意图数据做足够的分析,把首都机场分为T1、T2、T3航站楼,导入所有的航班信息,当用户给出航班号便可以得知航班的情况,对应出发和到达,并给出出发时间建议,把这些和语义技术结合在一起做出更好的服务。

他指出AI服务的本质包含两方面,第一是自然交互的技术,包括图像及语音,第二是知识的索引。他坦言,搜狗目前也在这两方面做出了巨大的努力:一方面在自然交互上,搜狗通过用户产生的大量数据不断完善语音识别、语义理解技术;另一方面,搜狗搜索也在做大量的知识索引,包括与微信、知乎的内容引入,明医搜索以及微软必应的合作等。今年4月,搜狗还向清华大学捐赠1.8亿人民币,成立了天工智能计算研究院,相关研究成果也将应用于搜狗下一代产品中。

在他看来,搜索引擎公司是人工智能基因最足的模式,天生就是大数据产品,容易获得用户交互的行为,所以数据本身对于推动整个人工智能研究会有巨大的帮助。只有把人工智能技术与领域的知识结合得足够好,才能够真正的在场景下解决好用户的需求欲望。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 搜索推荐
企业如何依靠人工智能实现客户参与
在过去几年里,银行面临着许多新问题,比如消费者预期不断上升、来自拥有优质客户体验的数字竞争对手的竞争、技术进步以及监管收紧。许多银行已经开始数字化,以应对这些挑战并保持相关性,但随着流量开始流向数字渠道,银行缩减了其分支网络,以节省成本。
73 0
企业如何依靠人工智能实现客户参与
|
机器学习/深度学习 人工智能 自然语言处理
客户参与的5个主要人工智能趋势
根据云计算通信和客户参与平台Twilio公司最新发布的一份调查报告,在客户参与方面有5个主要人工智能(AI)趋势。
107 0
|
Web App开发 机器学习/深度学习 人工智能
tutorabc CTO汤峥嵘:人工智能时代,技术能够真正改变教育
1988年考入清华大学计算机与科学技术系;之后留学美国,获纽约州立大学奥尔伯尼分校计算机学士学位和匹兹堡大学计算机硕士学位。在美国硅谷工作十年后,回国加入阿里巴巴集团,先后担任过淘宝网、支付宝、B2B的资深总监、日本阿里巴巴CTO。
312 0
tutorabc CTO汤峥嵘:人工智能时代,技术能够真正改变教育
|
机器学习/深度学习 人工智能 自然语言处理
搜狗的人工智能研发与应用:让技术在产品中创造更多用户价值
今年 4 月份,搜狗宣布与清华大学联合成立「清华大学天工智能计算研究院」,把人工智能作为重要战略发展方向,但一直没有透露太多关于具体人工智能研发和应用层面的信息。为此,机器之心对搜狗语音交互技术中心负责人王砚峰进行了专访,王砚峰介绍了搜狗的人工智能研究历史,以及在人工智能方面的产品创新思路。
224 0
搜狗的人工智能研发与应用:让技术在产品中创造更多用户价值
|
机器学习/深度学习 人工智能 自然语言处理
|
机器学习/深度学习 人工智能 自动驾驶