开发者学堂课程【达摩院智能语音交互 - 声纹识别技术:应用案例】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/775/detail/13640
应用案例
内容简介:
案例1天猫精灵智能音箱
案例2蚂蚁金服全球核身平台 阿里巴巴集团客服
在集团内外我们有像天猫精灵_AI智能语音终端和海尔电视_远场语音为用户提供
个性化的智能服务以天猫精灵为例。
案例1:天猫精灵智能音箱
双十一百万商品
注册、识别,检验,更新,删除
固定文本+动态密码
多档阀值选择
声纹存储及全量刷新方案
让用户注册了之后,他可以通过他的声音去识别具体是家庭中的那个成员去使用,然后去给他进行个性化的服务,比如说音乐推荐,电视节目推荐,购物推荐,同时还可以通过这一识别去进行,
当你通过天猫精灵在天猫淘宝上购物的时候,可以通过声纹去进行一个安全性的验证,同时在上面我们还推出一个声纹用户画像的功能,这功能就是说用户无需再像以前一样去主动的注册声音,而是将他在逐渐的和天猫精灵的交互中很自然的记住每一个用户的声音,
同时可以通过性别识别,年龄识别去刻画出整个家庭成员的构成,除了在刚才提到的智能音响,智能电视等智能家居会用应用之外,声纹技术在一些集团客服的核身也会有一些使用,在这个电话信道这个场景中最主要的区别就是流式的音频输入不是像文件那样子输入,第二个是他的文本是非固定的,用户可以在电话中说任意的内容,长度也是任意的,属于一种文本无关,他们的时间是一种较长的识别。
案例2:蚂蚁金服全球核身平台 阿里巴巴集团客服
1. 客服专员校验
2. 账户解挂失
3. 客服专员校验
分别:
1流式音频输入,实时声纹
2流式音频输入,实时声纹
3流式音频输入,实时声纹
1校验2校验 3校验
1非固定文本 2非固定文本 3非固定文本
1.8kHz电话语音输入 2.8kHz电话语音输入 3.8kHz电话语音输入
1. 多档阈值选择
2. 多档阈值选择
3. 多档阈值选择
1. 声纹自动更新,可选
2. 声纹自动更新,可选
3. 声纹自动更新,可选
1. 注册、校验、识别、更 新
2注册、校验、更新
3注册、校验、更新 、删除
1. 声纹客户端存储
2声纹客户端存储
3声纹存储及全量刷新方案