智能家居大时代,音箱的华丽逆袭路

简介: 叮咚智能音箱最大特点在于其不需要任何手动操作,直接通过语音来实现人机交互。叮咚内置 8 个 Mic,能够让用户在 5 米范围内实现语音控制功能。

image.png

在近日举行的 CES Asia 上,京东与科大讯飞成立合资公司后的首款产品叮咚智能音箱正式发布。

叮咚智能音箱最大特点在于其不需要任何手动操作,直接通过语音来实现人机交互。叮咚内置 8 个 Mic,能够让用户在 5 米范围内实现语音控制功能。

无论用户身在房间哪个位置,通过科大讯飞独有的远场识别技术外加多声道回声消除技术,叮咚音箱能过滤掉各种背景噪音,包括正在播放的音乐等,可准确地领会用户指令。

语音渐成智能音箱主流交互方式

国内电商大佬京东出的这款语音音箱,很容易就让人联想到亚马逊此前推出的 Echo 音箱。Echo 音箱可以通过连接网络来回答用户语音提出的诸如天气状况、时间查询等问题,同时还可以遵照用户指令在购物应用上“填写”购物清单。简单来说,它会一直在听你说话、并执行命令。Echo 使用云计算为用户提供全程服务式的语音服务。

image.png

其实在电商大佬涉水智能音箱市场前,国内的小智音箱就已经成为“全球首款可以语音控制的智能音箱”了。只需一句话,你就可以与小智音箱进行互动交流或者聊天,免去在手机等移动设备上输入指令或者在音箱上手动按键的繁琐操作步骤。

值得注意的是,小智音箱还通过开放接口,实现了与第三方智能设备的联动操控。小智音箱目前可以语音控制超过 30 家厂商的智能设备,未来还有更多第三方智能硬件设备加入其中。不难看出,除过传统的放音功能,语音音箱已经开始悄悄扮演起智能家居控制中心的角色。

image.png

作为叮咚音箱语音技术提供方的科大讯飞早在去年就推出了可以语音控制的智能音箱。最近亦有消息称,360 也将推出智能音箱产品,而且主打语音交互

智能音箱市场正在不断壮大,随着更多巨头涉足其中,主打语音交互的新一代音箱产品正在成为市场的明日之星。智能音箱的更大发展潜力,需要语音这种全新的交互方式来进行深挖。智能音箱这片蓝海市场,也容得下新创公司和科技巨头来共同打造。

对于京东推出主打语音交互的叮咚音箱,小智音箱联合创始人李传丰表示乐见其成,“语音音箱需要巨头来进行市场教育,我们一直以来的发展方向也得到了他们的认可”。

音箱更大发展潜力需要语音交互来挖掘

不少人可能会认为,可以连接手机的音箱就是智能音箱。那么问题来了,可以作为手机外置扬声器的无线音箱早在智能手机兴起潮之前就已经诞生了,索尼和诺基亚等都出过类似的配件产品。来到移动互联网时代,音箱和手机之间的交流多了个 App。用户可以通过手机端的 App 界面对音箱进行控制。但即便如此,这样的音箱产品依然谈不上有多智能。

任凭手机或其他源设备来进行控制,并且完全充当传声筒的角色,这绝不是真正智能的音箱产品。智能音箱本身是要有智慧的。

首先,作为一款声音设备,能与用户进行对话想必是极好的。过去,我们与音箱之间的对话是通过与内容源设备的交互(触摸屏幕或点按遥控器、按钮等)来进行的。现在和未来,我们与智能音箱之间的对话要逐渐由手机 App 转移到音箱本身。智能音箱的智慧要更多体现在,能自主与用户交流上。

回到家,对着智能音箱说一句,“我要听周杰伦的最新专辑,请你顺序播放”,然后它就开始播放 Jay 的最新作品了。

其次,智能音箱要拥有自个的内容源库,而不仅仅是充当别家设备的传声筒。音箱本身可以直接和这个云端曲库进行传输,音箱在完全脱离手机的条件下也能播放各种各样的音乐。云曲库搭配操作系统所构建的自主生态应该算是智能音箱的题中之义。

最后,除过提供音乐或其他内容消遣,智能音箱还应提供更多便捷服务。换言之,智能音箱要打造实体版的“语音助手”,能干和苹果 Siri、微软 Cortana 或谷歌 Google Now 等相同的服务工作。再联系到音箱产品的居家属性,智能音箱还应该成为智能家居生态体系中的重要一环,甚至充当中心设备角色。所以智能音箱必须具有开放接口,让其他的智能家居产品能接入其中。用户通过智能音箱就可以和家中的其他智能设备进行交流,并且用最为省事的语音方式来进行控制。

音箱要真正智能起来,必须要从交互方式开始变革。作为最贴切的交流方式,语音将在用户和音箱之间建立起真正智能的交互体验。有了这样的变革基础,智能音箱在给用户提供无处不在音乐享受的同时,也能提供无处不在的语音控制入口。握有命门的音箱将在智能新时代迎来华丽逆袭。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
机器学习/深度学习 人工智能 开发者
|
人工智能 物联网 人机交互
|
2月前
|
传感器 监控 搜索推荐
探索智能家居技术的未来
【10月更文挑战第6天】 本文深入探讨了智能家居技术的发展历程、当前应用及其未来前景。通过分析物联网(IoT)的基本原理和智能家居设备的实际应用案例,揭示了该领域面临的挑战与机遇,并提出了未来发展的趋势和可能性。
68 3
|
15天前
|
机器学习/深度学习 搜索推荐 语音技术
智能语音识别技术在智能家居中的应用与挑战####
本文深入探讨了智能语音识别技术的基本原理、关键技术环节,以及其在智能家居领域的广泛应用现状。通过分析当前面临的主要挑战,如环境噪音干扰、方言及口音识别难题等,文章进一步展望了未来发展趋势,包括技术融合创新、个性化服务定制及安全隐私保护的加强。本文旨在为读者提供一个关于智能语音识别技术在智能家居中应用的全面视角,同时激发对该领域未来发展方向的思考。 ####
51 6