盘点智能语音行业:Nuance没落 BAT围绕核心业务-阿里云开发者社区

开发者社区> 沉默术士> 正文

盘点智能语音行业:Nuance没落 BAT围绕核心业务

简介:
+关注继续查看

随着人工智能浪潮的来临,以及物联网场景下应用需求的不断扩大,智能语音技术在智能家居、智能汽车、教育等领域的应用逐步深入,带动着智能语音产业规模的持续快速增长。再加上“互联网女皇”玛丽·米克尔在报告中大篇章的描述语音识别交互带来的改变,今天借着这股智能语音之风,让我们盘点一下现如今国内外智能语音行业的发展现状。

国外巨头盘点: Nuance没落、亚马逊Google布局智能家居

Nuance

盘点智能语音行业:Nuance没落 BAT围绕核心业务

提及语音识别,就不能不说Nuance, Nuance有着辉煌的历史,曾经在语音领域一统江湖。虽然一步步被后起之秀所超越,但现在它仍旧是全球最大的语音技术公司,专利数量和市场份额都遥遥领先。苹果iPhone手机的虚拟语音助手Siri、三星的语音助手S-Voice、各大航空公司和顶级银行的自动呼叫中心以及虚拟在线语音助手,都采用了Nuance的一些技术。

不过,苹果和谷歌等巨头近年来都开始自建智能语音团队,并从Nuance不断挖角。2015年初有消息指出,苹果在Nuance的总部波士顿悄悄设立语音技术研发团队,以消除他们对这家公司的依赖。在招聘的过程中,他们把两位Nuance语音科学家Gunnar Evermann、Don McAllaster挖了过来。另外,Google也在做类似挖墙脚的事情。为了避开Nuance的专利障碍,Google在04年的时候就挖走了在Nuance工作十年的联合创始人Mike Cohen,并担任“语音掌门”开发相应的语音识别技术。

从人员流失这个角度来说,Nuance的技术壁垒是在不断地被变相“瓦解”,大公司对他们的依赖会不断的减少,甚至在未来的某一天终止相应的技术合作协议。

苹果

盘点智能语音行业:Nuance没落 BAT围绕核心业务

Siri作为苹果内置智能语音软件,依托苹果平台发展非常迅速,作为一款较为成功的语音软件,Siri更类似一个虚拟智能助手。通过Siri,用户可以设置提醒、发送短信或安排日程。搜索只是Siri的一部分,而Siri的搜索非常依赖“知识搜索引擎”Wolfram Alpha这种垂直搜索工具。后者的搜索服务能回答一些古怪的问题,例如“希腊的GDP是多少”,但并不擅长处理日常的关键词搜索,它的亮点就是人机的互动方面,不仅有十分生动的对话接口,其针对用户询问所给予精准的回答,有时候更是让人有种会心一笑的惊喜,甚至如果用户说出一些根本不符合语法的短词,Siri都会大概判断你的意图,并提出相关建议。在支持的语言领域,Siri更是精通英语、中文、法语、德语、日文、意大利文、西班牙文等多种语言,甚至可以区分出粤语和中国台湾地区语言,真正做到了智能识别,当然在一些具体语种上难以做到最好。

其突出优势还在于与ios系统的紧密的整合,目前状态下Siri已经常驻系统后台并且可以接管一些重要的系统功能了。

Google

盘点智能语音行业:Nuance没落 BAT围绕核心业务

Google Now是谷歌在I/O开发者大会上随安卓4.1系统同时推出的一款应用,根植于Google自己强大的搜索及周边技术,Google Now可以说是目前最好的语音助手方案。它会全面了解你的各种习惯和正在进行的动作,并利用它所了解的来为你提供相关信息。Google Now解决了Siri的缺陷,在各个方面都表现得更好。Google Now展示了在移动设备中的各种垂直搜索服务。相比于Siri,Google在搜索方面明显做的更好,2014年3月24日, Google Now语音服务正式登陆Windows和Mac桌面版Chrome浏览器,现在用户不仅可以在Android手机使用Google Now语音服务,也可在台式机和笔记本电脑上通过谷歌Chrome浏览器使用这一服务了。

另外,Google还在今年的I/O开发者大会上推出了智能家居中控Google Home,此举被看做是对标亚马逊的Echo在做一些针锋相对的布局,不过,毫无疑问,巨头们都十分看重在智能家居领域的布局。

微软

盘点智能语音行业:Nuance没落 BAT围绕核心业务

Cortana(小娜)是微软发布的全球第一款个人智能助理。它“能够了解用户的喜好和习惯”,“帮助用户进行日程安排、问题回答等”。Cortana可以说是微软在机器学习和人工智能领域方面的尝试。微软想实现的事情是,手机用户与小娜的智能交互,不是简单地基于存储式的问答,而是对话。它会 记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和“学习”包括手机中的文本文件、电子邮件、图片、视频等数据,来理解用户 的语义和语境,从而实现人机交互。Cortana与Siri、Google Now以及其他语音软件最大的不同就在于它拥有一个虚拟的“记事本”。微软对Cortana的描述为“你手机上的私人助手,为你提供设置日历项、建议、进程等更多帮助”,它能够和你之间进行交互,并且尽可能的模拟人的说话语气和思考方式跟你进行交流。

亚马逊

盘点智能语音行业:Nuance没落 BAT围绕核心业务

亚马逊旗下的Echo可以作为智能家居的控制装置,同时还是一款便携式扬声器,Alexa是预装在亚马逊Echo内的个人虚拟助手,可以接收及相应语音命令,Alexa可以被看成是亚马逊版的Siri语音助手。

在使用Echo的时候,只需要说一声“Alexa”,就可以开始询问问题,包括新闻、创建任务提醒、设定闹钟时间或播放音乐等。亚马逊Echo上市不到2年时间,销量预计已达到300万台。

我们也许可以推断,亚马逊Echo现阶段的成功,证明了智能语音在智能家居场景下的应用的合理性。

国内BAT布局智能语音:围绕核心业务

百度

盘点智能语音行业:Nuance没落 BAT围绕核心业务

百度语音其实很早就被确立为战略方向,2010年与中科院声学所合作研发语音识别技术,但是市场发展相对缓慢。因此直到2014年,百度重新梳理了战略,终于找对了人,请来了人工智能领域的泰斗级大师吴恩达,正式组建了语音团队,专门研究语音相关技术,由于有百度强大的资金支持,到2016目前为止收获颇丰,斩获了近13%的市场份额,其技术实力已经可以和拥有十多年技术与经验积累的科大讯飞相提并论。

阿里巴巴

盘点智能语音行业:Nuance没落 BAT围绕核心业务

阿里云在 2016年会上第一次公开展示实时语音识别技术,并现场挑战世界速记大赛亚军得主。据现场最终评测,机器人在准确率上以 0.67%的微弱优势战胜第 50 届国际速联速记大赛全球速记亚军姜毅。

据了解,从去年开始,阿里集团与蚂蚁客服每接听一个电话,都会立刻启动一个叫风语者的系统,它就是自动语音识别技术,将语音转变成文字,千分之三的人工抽检可以升级为100%的自动质检。除此应用场景之外,阿里YunOS、阿里小蜜以及手淘,现在都已经应用到阿里云的语音识别系统。

腾讯

盘点智能语音行业:Nuance没落 BAT围绕核心业务

2016年5月,腾讯云正式上线智能语音服务。智能语音是由腾讯微信AI团队自主研发的语音处理技术,可以满足语音识别、语音合成、声纹识别等需求。

腾讯云智能语音服务不仅能运用在语音质检中,在其他领域中也有布局,比如语音搜索、智能客服、身份鉴定。

国内智能语音新势力:百花齐放

科大讯飞

盘点智能语音行业:Nuance没落 BAT围绕核心业务

科大讯飞是目前国内市场上成立时间最长的智能语音公司,2008年在深圳中小企业板上市,目前市值约400亿人民币。科大讯飞是一家传统的TOB企业,主要客户是政府、中兴、华为、联想等电信设备商和终端商。应用领域从军用到民用,包括移动互联网、教育、车联网、智能家居等。同时科大讯飞提供语音云,支持多种方言,国内许多APP的语音识别功能都是用了讯飞的接口,如高德地图等。

云知声

盘点智能语音行业:Nuance没落 BAT围绕核心业务

云知声成立于2012年6月,是目前在人工智能创业公司里面,在智能语音领域做的市场规模最大的一家企业。

据了解,云知声打造了“云端芯”生态的业务体系,AI芯、AIUI、AI Service三大解决方案支撑起云知声核心技术的落地和实现。这些方案在家居、医疗、教育、车载等领域有广泛应用。

2016年4月,云知声宣布了其B+轮数千万美金的融资,并宣布品牌全新升级。之后,又推出了“AI芯”战略——和国际芯片巨头以及国内芯片企业全面深度合作,推出物联网智能芯片。目前,这些基于芯片的软硬一体方案已经被广泛应用到智能家居领域,与美的、格力、华帝、海信等多个知名品牌达成合作,联手打造了众多智能硬件产品。云知声合作伙伴目前超过两万家,在车载后装市场上有60%的市场份额。

出门问问

盘点智能语音行业:Nuance没落 BAT围绕核心业务

“出门问问”跟讯飞和云知声相比而言,比较偏重C端产品的研发。从微信语音助手到第一只智能手表、到目前的智能车载后视镜。出门问问希望通过打造爆款的方式来打开市场。

2014年12月,出门问问首款中文智能手表操作系统Ticwear发布。2015年6月,出门问问推出智能手表Ticwatch。是出门问问人工智能技术成功落地的一款可穿戴设备。2015年10月,出门问问宣布完成C轮融资,投资方为谷歌。虽然官方没有公布具体的融资金额,但透露该轮融资时,出门问问的估值是3亿美金。

2016年6月,出门问问正式推出首款车载机器人问问魔镜Ticmirror以及ADAS高级驾驶辅助系统问问魔眼Ticeye。

总结:

无论是国内还是国外的公司,都想牢牢的抓住未来互联网的下一个交互入口。在未来的物联网时代,智能语音作为最为符合应用场景的交互方式,也许会成为每个智能硬件的“标配”。 

本文转自d1net(转载)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
「阿里语音AI」十篇论文入选语音顶会INTERSPEECH2020
「阿里语音AI」十篇论文入选语音顶会INTERSPEECH2020,论文研究方向包含语音识别,语音合成,说话人识别,语音增强和信号处理
91 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10057 0
《BREW进阶与精通——3G移动增值业务的运营、定制与开发》连载之71---BREW中语音与短信的开发
版权声明:本文为半吊子子全栈工匠(wireless_com,同公众号)原创文章,未经允许不得转载。
536 0
【技术揭秘】任务型语音对话中的纠错系统
本文主要详细介绍语音对话中的纠错系统。纠错系统旨在对错误的语音识别结果进行鲁棒理解和修正,给业务后续搜索提供更准确的输入,以及改善识别展示结果。
151 0
语音顶会Interspeech 论文解读|Constrained output embeddings for end-to-end code-switching speech recognition with only monolingual data
Interspeech是世界上规模最大,最全面的顶级语音领域会议,本文为 Nanyang Technological University等学校联合作者的入选论文
706 0
语音顶会Interspeech 论文解读|Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition
Interspeech是世界上规模最大,最全面的顶级语音领域会议,本文为Shiliang Zhang, Ming Lei, Zhijie Yan的入选论文
1641 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13871 0
Fastdata极数:2019年中国即时配送行业发展分析报告
核心摘要: 即时配送市场规模将超千亿,竞争加剧:2019年6月即时配送C端及B端活跃用户超1600万,同比增长达23.6%,2019年上半年即时配送市场规模达623亿元,预计全年市场规模将超千亿。美团点评、饿了么、京东到家等大型本地生活服务平台开放配送能力,顺丰、京东物流、阿里菜鸟等行业巨头杀入,独立配送平台不断涌向,即时配送行业竞争加剧。
1296 0
天猫精灵发布“智慧屏”新品 将与平头哥共同定制语音芯片
9月25日,记者从云栖大会上获悉,天猫精灵将成为首款采用平头哥定制芯片的家用产品。按照规划,阿里人工智能实验室和平头哥共同定制开发的智能语音芯片TG6100N,在即将推出的音箱产品中使用。
248 0
+关注
5518
文章
253
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载