AI赋能语音交互Link Voice,让物品懂人

简介: 2018云栖大会深圳峰会阿里云IoT物联网技术专场上,阿里云IOT事业部高级技术专家龙一民在深圳云栖大会给大家介绍了AI赋能语音交互Link Voice。从内容和智能家居生态角度阐述了Link Voice的广阔前景,着重从从前端硬件,数字信号处理,到云端数据处理详细分析了Link Voice的优势。

2018云栖大会深圳峰会阿里云IoT物联网技术专场上,阿里云IOT事业部高级技术专家龙一民在深圳云栖大会给大家介绍了AI赋能语音交互Link Voice。从内容和智能家居生态角度阐述了Link Voice的广阔前景,着重从从前端硬件,数字信号处理,到云端数据处理详细分析了Link Voice的优势。

数十款阿里云产品限时折扣中,赶快点击这里,领券开始云上实践吧!

直播视频回顾

以下为精彩视频内容整理:

云平台简介

目前市场主流的智能语音平台为阿里云、Google、Amazon和苹果公司。Link Voice云平台是阿里云研发的智能语音平台,旨在通过阿里云平台资源帮助更多公司及用户实现智能语音交互。

3441170560070c07545511452b5d2b0f61c2e6a2

我们把智能家居分为家居、家电、运动健康和汽车车载等四个场景,这些场景里面的设备都会具有语音交互能力。个人猜想扫地机器人未来除了语音交互能力之外还添加视觉采集能力,这样具备巡逻能力的设备可以帮用户观察家里房间安全、老人和儿童的位置安全等功能。同时运动健身方面智能耳机也是我们关注的一个设备,去年苹果发布了Earpods,阿里云也和侯氏联合在设计一款蓝牙耳机,在耳机里内置本地化处理、本地化唤醒等技术。去年我们也和新中心合作了车载蓝牙市场,之后发布了基于蓝牙耳机的解决方案,也是支持本地唤醒的。

0139110cb14286ebdc7985e67d7e2a5203960852

Link Voice平台有两大优势,一个是内容优势,另一个是智能家居生态优势。由上左图调研报告中可以看出,大家最感兴趣的云端内容其一是智能家居控制,其二是信息获取比如音乐、电台等内容。在AliOS Things上可以找到版权超过两千万的虾米音乐,还有喜马拉雅、蜻蜓FM、贝瓦儿歌等内容合作伙伴。在智能家居生态方面,现在已经拥有超过千万台设备在阿里云上运行。通过云端系统,不仅可以让设备控制设备本身,也可以让设备控制其他设备的操作。甚至可以告诉家里的冰箱,半小时之后打算出门,请出租车停在北门这样的指令,都可以帮助用户完成。

端模块介绍

e687a8f228e7fb0b5832e24ea1b4caf97b8f6600

语音产品从前端硬件,到数字信号处理,到云端数据处理,其实是一个多领域交叉融合的产品。所以Link Voice把每一类问题细分并解决处理,提供给大家一站式开发能力。由上图可以看到,Link Voice在硬件方面具备多项优点,可以兼容多个操作系统,声学信号处理方面具备声源定位、回声消除、噪音消除等特点,算法方面概括多项主流操作,并且依赖于阿里云平台各项资源,具有强大竞争力。

1ff8c80ece364a4e3fa6a185b22eac73318cb709

在整个语音行业里面,Link Voice实际上是提供了很多B2B、B2C的商业模式。有很多传统家具家电行业合作厂商,会把产品进行语音化改造,经过一站式开发和平台赋能之后,最后经过验收测试,推广到应用市场上。Link Voice支持厂家或者用户可以自定义语音唤醒词,更加满足多元的用户体验。

d712d8eaee8c8a24a037c2038cced34dd627fe98

在交互方式方面,大家可以看到最后的硬件设备分类。Push Talk就是设备上有一个按键,开始按同时识音开始,结束按识音结束。Tab Talk意思是设备上有按键,开始按同时识音开始,系统自动判别结束时间点。Far Field就是所谓的无接触式远场识音,就是通过唤醒词唤醒。目前这三种唤醒方式Link Voice都支持。

产品介入研发流程

下面着重和大家介绍,如何利用Link Voice做出一个属于自己的云单品。

70bbf8d55e5b006b53ca68ac3c65d198ea85f506

在操作系统AliOS Things上,会有一个WiFi的id,还有一个DSP本地声控或者本地神经网络的部分,主要是做本地化识音处理,以上构成了一个经典的设备模组模型。

0d7f13d87e2f99a64b48a1a5d3845fdaa3d7ac91

然后在麦克风阵列的数量上面,Link Voice也支持本地端麦克风阵列自定义。当然数量越多价格越高。

f63d770584ae89abc6e46d23aaf8eaa958b54f2d

以跑步机为例,如果客户自由一个智能化的单品希望借助云的能力。一般是先提供产品模型,了解到产品的模型,我们会帮助产品挑选核实的合作伙伴及类型。举个例子,如果不需要本地化的模组,就可以通过轻量方式连接云端;如果需要本地化处理,可以接入合作商家芯片做本地唤醒或者本地语音识别模组。之后安装麦克风,接下来开发者可以利用一站式开发平台开发适合自己的语音交互应用,我们所有的云端资源都是开放的。最后进行产品认证测试,Link Voice产品的声学验证测试包括基本功能测试集、常用指令识别率音响设备交互控制、误唤醒率、唤醒率等指标。利用消音室、半消音室、环境噪音等条件,从不同方位,从用户不同的声音音调、分贝数等方面,对产品做一个全方位的认证和测试,测试过后可以发布上线。

我们的宗旨就是希望借助阿里云平台的力量,和供应商、开发者一起为传统的物理世界里面的物,提供语音交互能力,希望能得到更多的支持和合作。

本文由云栖志愿小组王晓慧整理编辑

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
5天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
38 9
|
22天前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
33 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
8天前
|
人工智能 自然语言处理 语音技术
智能语音交互:AI如何重塑人际沟通###
【10月更文挑战第22天】 本文旨在探讨智能语音交互技术如何深刻改变我们的人际沟通方式,从历史沿革、技术原理、应用领域到未来趋势,全面剖析这一AI技术的魅力与影响。通过生动实例与通俗语言,揭示智能语音交互背后的科技力量,以及它如何让沟通更自然、高效,同时引发关于隐私、伦理等问题的深思。 ###
25 4
|
19天前
|
存储 消息中间件 人工智能
ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用
本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用》。
|
2天前
|
机器学习/深度学习 人工智能 算法
AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
10月30日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。
|
22天前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
58 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
22天前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
24 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
智能语音交互:AI如何重塑人际沟通###
【10月更文挑战第27天】 一句话 本文将探讨智能语音交互技术如何深刻改变我们的沟通方式,从简单的命令识别到复杂的情感理解和多模态互动,揭示其背后的技术原理与未来趋势。 ###
|
5天前
|
安全 搜索推荐 机器学习/深度学习
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】在人工智能的推动下,个性化学习系统逐渐成为教育领域的重要趋势。深度学习作为AI的核心技术,在构建个性化学习系统中发挥关键作用。本文探讨了深度学习在个性化推荐系统、智能辅导系统和学习行为分析中的应用,并提供了代码示例,展示了如何使用Keras构建模型预测学生对课程的兴趣。尽管面临数据隐私和模型可解释性等挑战,深度学习仍有望为教育带来更个性化和高效的学习体验。
23 0
|
18天前
|
存储 人工智能 安全
AI 赋能 UGC 内容审核解决方案
AI 赋能 UGC 内容审核解决方案

热门文章

最新文章