语音识别

简介: 语音识别简介

【Task简介】

一行命令即实现模型预测,输入简单的代码,就可以获取语音识别的最终结果;输入音频文件,运用模型轻松实现语音转文字

【说明视频】



【输入与输出】

input是一条wav,output是这条语音的文本内容


【场景应用】

将音频文件转为文档记录,比如会议录音转文字、采访面试录音转文字、培训课程音频转文字等


【模型链接】

模型文件:https://www.modelscope.cn/models/damo/speech_paraformer_asr_nat-zh-cn-16k-common-vocab8358-tensorflow1/files

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
14天前
|
机器学习/深度学习 自然语言处理 算法
什么是语音识别的智能客服?
【4月更文挑战第7天】
28 0
|
14天前
|
机器学习/深度学习 自然语言处理 搜索推荐
什么是语音识别的语音搜索?
【4月更文挑战第7天】
26 0
什么是语音识别的语音搜索?
|
13天前
|
机器学习/深度学习 数据采集 算法
深度学习在语音识别方面的应用
【4月更文挑战第8天】
26 3
深度学习在语音识别方面的应用
|
13天前
|
机器学习/深度学习 自然语言处理 算法
什么是语音识别的语音助手?
【4月更文挑战第8天】
24 3
什么是语音识别的语音助手?
|
1月前
|
人工智能 自然语言处理 前端开发
自然语言处理语音识别
自然语言处理语音识别
30 6
|
9月前
|
语音技术
|
10月前
|
机器学习/深度学习 传感器 算法
【语音识别】基于匹配滤波器语音识别附matlab代码
【语音识别】基于匹配滤波器语音识别附matlab代码
|
10月前
|
机器学习/深度学习 存储 人工智能
Synthesys:语音合成和视频生成平台
Synthesys:语音合成和视频生成平台
655 0
Synthesys:语音合成和视频生成平台
|
机器学习/深度学习 自然语言处理 达摩院
语音合成技术|学习笔记
快速学习语音合成技术
381 0
语音合成技术|学习笔记
|
机器学习/深度学习 自然语言处理 达摩院
语音识别技术|学习笔记
快速学习语音识别技术
248 0
语音识别技术|学习笔记