在客户与语音识别系统进行多次会话过程中,系统具有智能调整识别策略,能够自动根据对话节点来动态调整语音识别策略,通过训练典型节点语言模型(如,开场白节点语言模型),在客户不同节点语音交互时,加载相应节点的语言模型与通用语言模型融合,共同处理用户输入,如图17所示。并且,系统也能够根据系统运行情况来动态调整语音识别策略,在系统较忙时(CPU占用较高)采用计算量较小但具有足够精度的策略以保证系统的响应速度,在系统不忙时(CPU占用较低)采用精度更高的策略以达到更优的识别结果,该功能在保障稳定运行的基础上充分利用系统的计算资源,有利于保护客户的设备投资。
语音识别呼叫日志
语音识别的呼叫日志在系统中有着非常重要的作用,该日志记录输入的音频、加载的语法、识别过程的中间结果、识别模块呼叫过程、识别使用的各种参数、识别结果、音频前瞻缓冲信息、断句方式以及当时的系统环境信息,这些数据显示在运营系统中,为效果分析和优化的基础和依据。
语音合成
语音合成,能够将输入文本实时转换成流畅、清晰、自然、具有表现力的语音数据,输出高质量的语音。
1.能够保证对文本中未登录词、多音字、特殊符号(如标点、数字)、韵律短语的智能分析和处理;
2.能够支持输入GB2312、GBK、Unicode、UTF-8等多种字符集以及普通文本等多种格式的文本信息;
3.能够提供预录音合成模板,对合成文本中符合语音模板固定成分的文本使用发音人预录语音,非固定成分使用合成语音,改进合成效果,满足更广泛的需求;
4.能够提供音量、语速、音高(基频)等多种合成参数的动态调整功能。