应用案例| 学习笔记

简介: 快速学习应用案例

开发者学堂课程达摩院智能语音交互 - 声纹识别技术应用案例】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/775/detail/13640


应用案例

内容简介:

案例1天猫精灵智能音箱

案例2蚂蚁金服全球核身平台 阿里巴巴集团客服

在集团内外我们有像天猫精灵_AI智能语音终端和海尔电视_远场语音为用户提供

个性化的智能服务以天猫精灵为例。


案例1:天猫精灵智能音箱

双十一百万商品

注册、识别,检验,更新,删除

固定文本+动态密码

多档阀值选择

声纹存储及全量刷新方案

让用户注册了之后,他可以通过他的声音去识别具体是家庭中的那个成员去使用,然后去给他进行个性化的服务,比如说音乐推荐,电视节目推荐,购物推荐,同时还可以通过这一识别去进行,

当你通过天猫精灵在天猫淘宝上购物的时候,可以通过声纹去进行一个安全性的验证,同时在上面我们还推出一个声纹用户画像的功能,这功能就是说用户无需再像以前一样去主动的注册声音,而是将他在逐渐的和天猫精灵的交互中很自然的记住每一个用户的声音,

同时可以通过性别识别,年龄识别去刻画出整个家庭成员的构成,除了在刚才提到的智能音响,智能电视等智能家居会用应用之外,声纹技术在一些集团客服的核身也会有一些使用,在这个电话信道这个场景中最主要的区别就是流式的音频输入不是像文件那样子输入,第二个是他的文本是非固定的,用户可以在电话中说任意的内容,长度也是任意的,属于一种文本无关,他们的时间是一种较长的识别。


案例2:蚂蚁金服全球核身平台 阿里巴巴集团客服

1.  客服专员校验

2.  账户解挂失

3.  客服专员校验

分别:

1流式音频输入,实时声纹

2流式音频输入,实时声纹

3流式音频输入,实时声纹

1校验2校验 3校验

1非固定文本 2非固定文本 3非固定文本

1.8kHz电话语音输入 2.8kHz电话语音输入 3.8kHz电话语音输入

1.  多档阈值选择

2.  多档阈值选择

3.  多档阈值选择

1.  声纹自动更新,可选

2.  声纹自动更新,可选

3.  声纹自动更新,可选

1.  注册、校验、识别、更 新  

2注册、校验、更新

3注册、校验、更新 、删除

1.  声纹客户端存储

2声纹客户端存储

3声纹存储及全量刷新方案

相关文章
|
人工智能 算法 数据挖掘
【技术揭秘】解锁声纹技术中的说话人日志
说话人日志(speaker diarization)也叫说话人分离,它是从一个连续的多人说话的语音中切分出不同说话人的片段,并且判断出每个片段是哪个说话人的过程。借助说话人日志技术可以完成对音频数据流的结构化管理,具有广泛的应用价值,例如可以利用分离结果进行说话人自适应,以提高语音识别的准确率;可以辅助会议、电话数据进行自动转写构建说话人的音频档案;也可以利用说话人分离技术,实现语料库的自动跟踪和标注。
【技术揭秘】解锁声纹技术中的说话人日志
autojs之停用音量上停止脚本
autojs 8.7.1自带示例中提供了某些开关
2214 0
【HCIP】01.RSTP
【HCIP】01.RSTP
155 0
|
8月前
|
XML 人工智能 文字识别
Mobile-Agent:通过视觉感知实现自动化手机操作,支持多应用跨平台
Mobile-Agent 是一款基于多模态大语言模型的智能代理,能够通过视觉感知自主完成复杂的移动设备操作任务,支持跨应用操作和纯视觉解决方案。
2613 10
Mobile-Agent:通过视觉感知实现自动化手机操作,支持多应用跨平台
|
10月前
|
存储 安全 关系型数据库
Blossom:开源私有部署的markdown笔记软件
Blossom 是一款功能强大的开源笔记软件,支持私有部署,可将笔记、图片、个人计划等数据保存在自己的服务器中,并实现实时同步。它还具备动态博客功能,方便记录和分享内容。Blossom 支持多种设备,提供完善的文件管理、快速迁移和丰富的附加功能,是个人知识管理和博客展示的理想选择。
477 7
Blossom:开源私有部署的markdown笔记软件
|
7月前
|
算法 程序员 Linux
理解内存管理机制
概念 • 假设计算机的内存就像一个大仓库,这个仓库被人为地划分成几个固定大小的区域,每个区域就是一个分区。比如把100MB的内存划分成5个分区,每个分区20MB。当一个程序需要运行时,操作系统会根据程序的大小,把它分配到一个合适的分区中。如果程序大小是15MB,就把它放到一个20MB的分区里。 • 这种方式的优点是实现简单。就像仓库管理员只需要按照固定的格子来存放货物,不需要复杂的计算和调整。缺点是内存利用率低。因为分区大小是固定的,如果程序大小只有10MB,却分配了20MB的分区,那么剩下的10MB就浪费了。而且如果程序太大,超过了分区的大小,就无法运行。 应用场景 • 在早期的计算机系统中
104 4
|
11月前
|
存储 NoSQL 关系型数据库
【redis】认识redis和分布式系统
【redis】认识redis和分布式系统
127 1
|
11月前
|
IDE API 开发工具
沉浸式集成阿里云 OpenAPI|Alibaba Cloud API Toolkit for VS Code
Alibaba Cloud API Toolkit for VSCode 是集成了 OpenAPI 开发者门户多项功能的 VSCode 插件,开发者可以通过这个插件方便地查找API文档、进行API调试、插入SDK代码,并配置基础环境设置。我们的目标是缩短开发者在门户和IDE之间的频繁切换,实现API信息和开发流程的无缝结合,让开发者的工作变得更加高效和紧密。
沉浸式集成阿里云 OpenAPI|Alibaba Cloud API Toolkit for VS Code
|
11月前
|
SQL 安全 关系型数据库
sql注入原理和sqlmap命令的基础命令以及使用手法
sql注入原理和sqlmap命令的基础命令以及使用手法
|
JSON 数据格式 Python
我们需要安装`authlib`模块(如果尚未安装):
我们需要安装`authlib`模块(如果尚未安装):

热门文章

最新文章