Facebook语音识别野心曝光,测试Aloha,挑战苹果Siri

简介:

提到语音识别,多数人第一反应想到的会是亚马逊Alexa,谷歌Google Assistant或者苹果Siri。对于社交巨头Facebook,似乎在该领域还是一片空白,毕竟连智能音箱这个硬件产品还处于开发中状态。但一个名叫Jane Manchun Wong的开发人员表示,他在Facebook、Messenger的App中,发现了一项被标记为“语音测试”,代号为Aloha的语音识别功能,或许将来有可能发展成语音助理,与苹果Siri等展开竞争。

种类繁多的智能音箱市场

借助于语音识别技术,Facebook将不仅仅局限在手机、计算机、平板上。比如,今年年初就有消息初传出,表示该公司要推出一款具备视频通话功能的智能音箱Portal,对战亚马逊、谷歌、苹果等巨头的产品。

不过从现在的情况来说,手机基本上都已经搭载了Siri、Google Assistant、Bixby等智能语音助理,各大科技巨头也都推出自己的智能音箱。在这个市场上,产品种类繁多,以相对拥挤。根据Canalys分析2018年第二季度的数据,排名第一的谷歌共卖出540万台Google Home,占比32.3%;亚马逊卖出410万台Echo,占比24.5%;而位居第三的阿里,其产品天猫占比17.7%。像苹果的HomePod因起步较晚,目前占比仅为 6%.

306b4a3b5428d1ea04c790dc6747b2af11c3669b

如今,对Facebook来说,不仅已经被远远落下,还有泄露隐私的前例,如果没有过硬的产品功能出现,在智能音箱领域或许很难杀出重围,走出自己的道路。

Facebook测试Aloha,将语音转为文字

最新消息显示,研究员Jane Manchun Wong在Facebook、Messenger的App中,发现了代号为Aloha的语音助理功能,根据测试片段,可以看到当用户说话时,画面上立刻将声音转化成文字。

ece6f57f4c9e857a02373949e2b714608300e7c9

而代码显示,这套语音功能需要Wi-Fi或蓝牙连接,这就意味着,Aloha很有可能跟Siri、Google Assistant一样,是个跨平台语音助理,可以搭载在手机、音响等不同产品上。目前该系统只能执行语音转文字功能。因此,研究人员推测,Facebook可能以这个功能为基础,在确立研发方向后再开发更完整的系统。

今年年初,Facebook宣布终止进行了两年测试的智能助理M项目。随后传出会推出一款可进行视频聊天的产品Portal,外观与亚马逊的Echo Show非常相似,而这也是Facebook Building 8实验室首次完成的产品,预计将用来对战亚马逊、谷歌、苹果等公司的智能音箱产品。

对于这款音箱,本来它的名字是Aloha。后来,和亚马逊一样,智能音箱和语音助手分别有两个名字,一个叫Echo,一个叫Alexa;Facebook也给它改了名字,音箱叫Portal,语音助手叫Aloha。原本Portal计划在今年5月的F8上推出的,但受剑桥分析事件的影响, 推迟发布了。

实际上,之前Facebook也曾试图推出消费电子产品。比如,2013年与HTC合作研发了搭载Android系统的Facebook手机,但没能成为一款成功的硬件产品;2014年,收购VR公司Oculus,从低价策略到推出VR一机体,暂时也没取得亮眼成绩。如今,Facebook涉足智能音箱领域,或许这个语音识别软件将成为串联该公司其他产品的关键。


原文发布时间为:2018-08-22

本文作者:Sandy

本文来自云栖社区合作伙伴“人工智能观察”,了解相关信息可以关注“人工智能观察”。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
7月前
|
机器学习/深度学习 并行计算 测试技术
MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试
如果你是一个Mac用户和一个深度学习爱好者,你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX,一个在苹果芯片上高效运行机器学习模型的框架。
361 1
|
2月前
|
人工智能 自动驾驶 机器人
【通义】AI视界|苹果自动驾驶汽车项目画上句号:加州测试许可被取消
本文精选了24小时内的重要科技新闻,包括Waymo前CEO批评马斯克对自动驾驶的态度、AMD发布新款AI芯片但股价波动、苹果造车项目终止、Familia.AI推出家庭应用以及AI逆向绘画技术的进展。更多内容请访问通义官网体验。
|
编解码 缓存 监控
app测试知识点,adb命令,日志(安卓和苹果)查看,软件后缀,专项测试等
app测试知识点,adb命令,日志(安卓和苹果)查看,软件后缀,专项测试等
|
人工智能 自然语言处理 机器人
Siri太笨,根本打不过ChatGPT!苹果加急测试语言生成AI
Siri太笨,根本打不过ChatGPT!苹果加急测试语言生成AI
113 0
|
Web App开发 移动开发 数据安全/隐私保护
免苹果开发者账号申请iOS上架及证书打包ipa测试(2022最新详解)
免苹果开发者账号申请iOS上架及证书打包ipa测试(2022最新详解)
1292 0
免苹果开发者账号申请iOS上架及证书打包ipa测试(2022最新详解)
|
iOS开发 开发者
免苹果开发者账号申请ios证书打包ipa测试
免苹果开发者账号申请ios证书打包ipa测试
免苹果开发者账号申请ios证书打包ipa测试
|
前端开发 JavaScript 容器
【React高级技术】合成事件以及 Test Utilities测试框架在Facebook内部进行测试
【React高级技术】合成事件以及 Test Utilities测试框架在Facebook内部进行测试
|
测试技术 语音技术
天猫精灵开放平台语音识别测试体验
天猫精灵目前来讲不够聪明,“呆头呆脑”,语音识别能够帮助天猫精灵更聪明,但目前还受到较多限制。
932 0
天猫精灵开放平台语音识别测试体验
|
机器学习/深度学习 人工智能 自然语言处理
无监督学习站起来了!Facebook第三代语音识别wav2vec-U,匹敌监督模型,Lecun看了都说好
Facebook在语音识别上又出重磅新作,继wav2vec, wav2vec 2.0以来,又出完全不需要监督数据的wav2vec-U,小众语言也能用语音识别啦!
581 0
无监督学习站起来了!Facebook第三代语音识别wav2vec-U,匹敌监督模型,Lecun看了都说好
|
Go vr&ar iOS开发
Facebook截胡苹果,率先与AR屏幕厂商Plessey达成合作
近年来科技大佬们布局AR(增强现实)的愿望很强烈,早就有传闻称Facebook正在研发AR眼镜,公司也在去年证实了这一消息。
157 0
Facebook截胡苹果,率先与AR屏幕厂商Plessey达成合作