Alexa 一键下单不好用?蓦然认知推出语音对话购物-阿里云开发者社区

开发者社区> 玄学酱> 正文

Alexa 一键下单不好用?蓦然认知推出语音对话购物

简介: 他们会继续将语音与生活服务结合在一起,更好的完善语音对话购物。MOR 也会集成于汽车、家居等硬件设备上,为用户提供人机对话及决策服务,打造一个可快速移植、实时学习、多场景融合的对话交互及决策系统。
+关注继续查看

“我坚定的不看好智能音响作为语音的入口,Echo 自己也不看好,要不然干嘛推出 Echo Show?” 蓦然认知联合创始人龚思颖反问道。

在她看来,现在语音入口的设备,包括电视、手表和眼镜,最终的形态现在依然没有定论。但她坚信的一点是,要让语音真正落地,成为被用户所接纳的最常用交互方式,最终要解决的是用户头部需求。 

“不论是查天气还是查时间,都非头部需求,这些需求只是一种测试语音助手基础功能的最基本条目,而衣食住行是用户的基本需求,沟通需求也是用户的基本需求。许多专注语音的团队都将目标定位在家居、车载等方向上是有道理的,比如在车载环境下,打电话、发短信就是头部需求,而在家居场景下打电话和发短信就没有那么重要了,起码在电视上没那么被需要了。在衣食住行场景下,分别对应着不同需求:语音购物、点餐、订餐馆、订酒店、预订出行飞机票以及景点门票,都是大众的生活服务需求。”她说。

在此基础上,龚思颖告诉雷锋网,最近,蓦然认知做出了第一个语音对话购物服务,用户可以通过对话实现订咖啡、订外卖、购买电影票以及一系列多维度的购物需求。

“我们 9 月 15 日开了一个大 Party,所有的闭环研发人员都有参加,大家围在电视旁用对话买买买,订了晚餐和夜宵,还有周末电影票。本身做闭环的小哥一边演示一边接受询问,产品和测试当场也记下来一些产品改进意见和 Bug 。语音对话闭环就是在不断调试、测试中成长起来的,解决的都是头部需求。 ”

不过,不同于诸如 Magic 这种助理型产品,MOR 全部以 AI 语音交互完成服务,全程无人工干预。据其介绍,其可规模化程度高,运营成本低。

现有的服务闭环是基于屏幕的手触操作,在手触之外扩展了语音对话的交互,可以满足用户在更多生活场景下、不同需求下的交互方式。以订咖啡为例,只需说上一句“给我订一杯拿铁”,MOR 就可以将咖啡送达到用户手上,如果你有“加奶不加糖”的需求,也只需要再说一句需求即可。当然,语音交互还能实现多硬件移植,没有屏幕也可以实现交互。

不过,GUI 与 VUI 结合才能为用户带来更好的体验。 虽然无屏交互在 Alexa 中也曾应用,但它的语音购物为人们所诟病,比如,它只能做到一键购物,购买之前买过的东西,此外,由于屏幕交互的时候是一目十行,速度上明显要快于语音交互,“尤其在音响上用纯语音购物,这种方式就已经被行业认定为是一个失败的案例。”龚思颖说道。

因此,之后的 Echo 则变成以屏幕交互和语音交互相结合,在最近暴风发布的新一代 AI 电视里的语音对话购物与此类似,而它在语义理解部分的技术方案由蓦然认知提供。

不过,GUI 跟 VUI 的结合也面临一些挑战,最难的还是同步问题,但蓦然认知目前也有自己的解决方案去做进一步优化。

“因为中间的语音理解、语义理解就已经很难了,然后你把 VUI 做完之后,它有时不能快速告诉用户想要的结果,你也只能够以语音对话的方式交互。但这样,有的时候我就是觉得我按一下更快,那这个时候就叫 GUI”,如果只做 GUI,就跟传统的方式没有任何区别,龚思颖向雷锋网(公众号:雷锋网)解释说 。

还有一点是要改变用户传统的 GUI 方式,改变用户习惯是一件循序渐进的事,他们要做的就是让语音交互成为主导,从而增加用户黏性。

除了上述问题,龚思颖向雷锋网表示,就上下文对话的语义理解这项技术而言,在整个行业里都是一个难点,“95% 以上的(AI)公司都会被排除在外”,她的隐含意思很明显,另外的 5% 必然有蓦然认知一席之地。其次,如果要解决衣食住行这些庞杂的头部需求,就要有一个强大的知识图谱来支撑,此外,因为要接不同的服务,“系统就要有一套快速可移植的对话模型,而不只是像以前单纯的写规则。”

作为一家在商业模式和市场拥有清晰定位的创业公司,龚思颖表示,蓦然认知今年依然还是瞄准智能车载和智能家居行业,他们在智能车载中的产品在逐渐落地,在未来,他们会继续将语音与生活服务结合在一起,更好的完善语音对话购物。MOR 也会集成于汽车、家居等硬件设备上,为用户提供人机对话及决策服务,打造一个可快速移植、实时学习、多场景融合的对话交互及决策系统。



本文作者:王金许
本文转自雷锋网禁止二次转载,原文链接

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10077 0
独特的直播形式——一对一语音聊天独特的直播形式——一对一语音聊天
4G技术的发展给移动直播带来了巨大的商机,全民直播的新时代,音视频结合的一对多直播形式在直播市场中占据着各大主流媒体。然而随着直播市场逐渐饱和,单一的一对多视频直播已经不能满足观众的需求,更能贴近人们需求的一对一直播逐渐发展起来。一对一语音聊天更是有着普通的一对多视频直播无法媲美的优越性。
269 0
《BREW进阶与精通——3G移动增值业务的运营、定制与开发》连载之71---BREW中语音与短信的开发
版权声明:本文为半吊子子全栈工匠(wireless_com,同公众号)原创文章,未经允许不得转载。
536 0
一对一直播开发,语音聊天的路还能走多久
一对一直播开发从问世到现在已经经历了多次洗礼,在直播、短视频热度趋于平稳后,一对一直播的关注量和入驻流量变得越来越多。
67 0
爆肝一周,用Python在物联网设备上写了个智能语音助手-阿里云智能对话机器人-《神奇的物联网》
本章节介绍如何开通智能对话机器人,并通过实际案例演示如何为机器人配置知识库并进行发布。
152 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13884 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
11889 0
语音顶会Interspeech 论文解读|Fast Learning for Non-Parallel Many-to-Many Voice Conversion with Residual Star Generative Adversarial Networks
Interspeech是世界上规模最大,最全面的顶级语音领域会议,本文为Shengkui Zhao, Trung Hieu Nguyen, Hao Wang, Bin Ma的入选论文
1136 0
+关注
玄学酱
这个时候,玄酱是不是应该说点什么...
20710
文章
438
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载