ai智能机器人调整识别策略-阿里云开发者社区

ai智能机器人调整识别策略

2022-09-21 276

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ai智能机器人调整识别策略

在客户与语音识别系统进行多次会话过程中，系统具有智能调整识别策略，能够自动根据对话节点来动态调整语音识别策略，通过训练典型节点语言模型（如，开场白节点语言模型），在客户不同节点语音交互时，加载相应节点的语言模型与通用语言模型融合，共同处理用户输入，如图17所示。并且，系统也能够根据系统运行情况来动态调整语音识别策略，在系统较忙时（CPU占用较高）采用计算量较小但具有足够精度的策略以保证系统的响应速度，在系统不忙时（CPU占用较低）采用精度更高的策略以达到更优的识别结果，该功能在保障稳定运行的基础上充分利用系统的计算资源，有利于保护客户的设备投资。

语音识别呼叫日志

语音识别的呼叫日志在系统中有着非常重要的作用，该日志记录输入的音频、加载的语法、识别过程的中间结果、识别模块呼叫过程、识别使用的各种参数、识别结果、音频前瞻缓冲信息、断句方式以及当时的系统环境信息，这些数据显示在运营系统中，为效果分析和优化的基础和依据。

语音合成

语音合成，能够将输入文本实时转换成流畅、清晰、自然、具有表现力的语音数据，输出高质量的语音。

1.能够保证对文本中未登录词、多音字、特殊符号（如标点、数字）、韵律短语的智能分析和处理；

2.能够支持输入GB2312、GBK、Unicode、UTF-8等多种字符集以及普通文本等多种格式的文本信息；

3.能够提供预录音合成模板，对合成文本中符合语音模板固定成分的文本使用发音人预录语音，非固定成分使用合成语音，改进合成效果，满足更广泛的需求；

4.能够提供音量、语速、音高（基频）等多种合成参数的动态调整功能。

相关实践学习

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

ai智能机器人调整识别策略

语音识别呼叫日志

语音合成

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

ai智能机器人调整识别策略

语音识别呼叫日志

语音合成

热门文章

最新文章

相关课程

相关电子书

相关实验场景