NLP之ASR：基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略-阿里云开发者社区

NLP之ASR：基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略

2021-10-28 600

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

NLP自然语言处理_高级版，每接口累计50万次

NLP自然语言处理_基础版，每接口每天50万次

NLP 自学习平台，3个模型定制额度 1个月

简介： NLP之ASR：基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略

利用python进行语音生成

T1、调用win系统自带程序将文字转为语音读出

T2、利用python的pyaudio库进行实时录制，生成wav文件

T3、利用BAT、科大讯飞等的语音识别API(上传到BAT、科大讯飞等语音服务器)API将自定义文字，转换生成wav、mp3等文件

利用python进行语音识别

T1、利用BAT、科大讯飞等语音识别API(上传到百度语音服务器)API将生成wav、mp3等文件，识别转为文本内容

T2、后期更新……

百度语音调用流程http://yuyin.baidu.com/docs/asr/55

百度语音之错误码及常见原因http://yuyin.baidu.com/docs/asr/210

pyaudio：基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存https://blog.csdn.net/qq_41185868/article/details/80496939

ASR：基于pyaudio利用python进行语音生成、语音播放、语音识别总结及其案例详细攻略https://www.baidu.com/yunyaniu/articles/9104134.html

相关实践学习

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

NLP之ASR：基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略

利用python进行语音生成

利用python进行语音识别

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

NLP之ASR：基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略

利用python进行语音生成

利用python进行语音识别

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像