应用案例| 学习笔记

简介: 快速学习应用案例

开发者学堂课程达摩院智能语音交互 - 声纹识别技术应用案例】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/775/detail/13640


应用案例

内容简介:

案例1天猫精灵智能音箱

案例2蚂蚁金服全球核身平台 阿里巴巴集团客服

在集团内外我们有像天猫精灵_AI智能语音终端和海尔电视_远场语音为用户提供

个性化的智能服务以天猫精灵为例。


案例1:天猫精灵智能音箱

双十一百万商品

注册、识别,检验,更新,删除

固定文本+动态密码

多档阀值选择

声纹存储及全量刷新方案

让用户注册了之后,他可以通过他的声音去识别具体是家庭中的那个成员去使用,然后去给他进行个性化的服务,比如说音乐推荐,电视节目推荐,购物推荐,同时还可以通过这一识别去进行,

当你通过天猫精灵在天猫淘宝上购物的时候,可以通过声纹去进行一个安全性的验证,同时在上面我们还推出一个声纹用户画像的功能,这功能就是说用户无需再像以前一样去主动的注册声音,而是将他在逐渐的和天猫精灵的交互中很自然的记住每一个用户的声音,

同时可以通过性别识别,年龄识别去刻画出整个家庭成员的构成,除了在刚才提到的智能音响,智能电视等智能家居会用应用之外,声纹技术在一些集团客服的核身也会有一些使用,在这个电话信道这个场景中最主要的区别就是流式的音频输入不是像文件那样子输入,第二个是他的文本是非固定的,用户可以在电话中说任意的内容,长度也是任意的,属于一种文本无关,他们的时间是一种较长的识别。


案例2:蚂蚁金服全球核身平台 阿里巴巴集团客服

1.  客服专员校验

2.  账户解挂失

3.  客服专员校验

分别:

1流式音频输入,实时声纹

2流式音频输入,实时声纹

3流式音频输入,实时声纹

1校验2校验 3校验

1非固定文本 2非固定文本 3非固定文本

1.8kHz电话语音输入 2.8kHz电话语音输入 3.8kHz电话语音输入

1.  多档阈值选择

2.  多档阈值选择

3.  多档阈值选择

1.  声纹自动更新,可选

2.  声纹自动更新,可选

3.  声纹自动更新,可选

1.  注册、校验、识别、更 新  

2注册、校验、更新

3注册、校验、更新 、删除

1.  声纹客户端存储

2声纹客户端存储

3声纹存储及全量刷新方案

相关文章
|
Java 测试技术 容器
Spring框架-ObjectProvider更加宽泛的依赖注入
从上面的过程中我们可以看出,但Spring中某个Bean的依赖类型为ObjectProvider时,我们不需要提供一个ObjectProvider类型的Bean到容器中,只需要提供一个T类型的Bean到容器中,容器会自动将其包装成一个ObjectProvider,然后注入到依赖中
470 0
|
人工智能 算法 数据挖掘
【技术揭秘】解锁声纹技术中的说话人日志
说话人日志(speaker diarization)也叫说话人分离,它是从一个连续的多人说话的语音中切分出不同说话人的片段,并且判断出每个片段是哪个说话人的过程。借助说话人日志技术可以完成对音频数据流的结构化管理,具有广泛的应用价值,例如可以利用分离结果进行说话人自适应,以提高语音识别的准确率;可以辅助会议、电话数据进行自动转写构建说话人的音频档案;也可以利用说话人分离技术,实现语料库的自动跟踪和标注。
【技术揭秘】解锁声纹技术中的说话人日志
autojs之停用音量上停止脚本
autojs 8.7.1自带示例中提供了某些开关
2404 0
|
9月前
|
人工智能 前端开发 Java
十几行代码实现 Manus,Spring AI Alibaba Graph 快速预览
Spring AI Alibaba Graph 的核心开发已完成,即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统,功能丰富且灵活。文章通过三个示例展示了其应用:1) 客户评价处理系统,实现两级问题分类与自动处理;2) 基于 ReAct Agent 的天气预报查询系统,循环执行用户指令直至完成;3) 基于 Supervisor 多智能体的 OpenManus 实现,简化了流程控制逻辑并优化了工具覆盖度。此外,还提供了运行示例的方法及未来规划,欢迎开发者参与贡献。
|
人工智能
LangGraph:构建多代理动态工作流的开源框架,支持人工干预、循环、持久性等复杂工作流自动化
LangGraph 是一个基于图结构的开源框架,专为构建状态化、多代理系统设计,支持循环、持久性和人工干预,适用于复杂的工作流自动化。
1931 12
LangGraph:构建多代理动态工作流的开源框架,支持人工干预、循环、持久性等复杂工作流自动化
|
XML 人工智能 文字识别
Mobile-Agent:通过视觉感知实现自动化手机操作,支持多应用跨平台
Mobile-Agent 是一款基于多模态大语言模型的智能代理,能够通过视觉感知自主完成复杂的移动设备操作任务,支持跨应用操作和纯视觉解决方案。
4703 10
Mobile-Agent:通过视觉感知实现自动化手机操作,支持多应用跨平台
|
11月前
|
算法 程序员 Linux
理解内存管理机制
概念 • 假设计算机的内存就像一个大仓库,这个仓库被人为地划分成几个固定大小的区域,每个区域就是一个分区。比如把100MB的内存划分成5个分区,每个分区20MB。当一个程序需要运行时,操作系统会根据程序的大小,把它分配到一个合适的分区中。如果程序大小是15MB,就把它放到一个20MB的分区里。 • 这种方式的优点是实现简单。就像仓库管理员只需要按照固定的格子来存放货物,不需要复杂的计算和调整。缺点是内存利用率低。因为分区大小是固定的,如果程序大小只有10MB,却分配了20MB的分区,那么剩下的10MB就浪费了。而且如果程序太大,超过了分区的大小,就无法运行。 应用场景 • 在早期的计算机系统中
170 4
|
存储 安全 关系型数据库
Blossom:开源私有部署的markdown笔记软件
Blossom 是一款功能强大的开源笔记软件,支持私有部署,可将笔记、图片、个人计划等数据保存在自己的服务器中,并实现实时同步。它还具备动态博客功能,方便记录和分享内容。Blossom 支持多种设备,提供完善的文件管理、快速迁移和丰富的附加功能,是个人知识管理和博客展示的理想选择。
856 7
Blossom:开源私有部署的markdown笔记软件

热门文章

最新文章