什么是语音识别(ASR) ?-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

什么是语音识别(ASR) ?

2017-10-25 15:01:51 5936 0

语音识别服务,可以把语音识别为文字,针对不同的使用场景,阿里云提供如下三种服务:
  • 「 一句话识别 」对一分钟内的短语音实时识别,适用于对话聊天,控制口令等较短的语音识别场景。
  • 「 实时语音识别 」:对长时间的语音数据流实时识别,适用于会议演讲、视频直播等长时间不间断识别的场景。
  • 「 录音文件识别 」:对录音文件中的语音做识别。


各服务的主要差别如下:

服务时效性支持的语音格式支持调用方式
一句话识别 SDK实时识别PCM/WAV/SPEEX/OPUS[1]Java/C++/Android/iOS
一句话识别 RESTful[2]非实时,不超过1分钟PCM/WAV/SPEEX/OPUS[1]HTTP RESTful API
实时语音识别实时识别PCM/WAVJava/C++/Android/iOS
录音文件识别非实时,免费版24小时内支持大部分常见编码格式,WAV/MP3效果最佳HTTP RESTful API
  • 注[1]:OPUS编码格式说明
  • 注[2]:一句话RESTful调用方式与其他方式差异较大,所以单独列出


附加能力

  • 针对无线使用场景,我们在移动端SDK中集成了录音(Recoder)、静音检测(VAD)、断网恢复后续传等功能,可以极大地简化App开发。
  • 针对用户领域特有的关键词,我们提供用户自定义热词功能,可以显著提高这些关键词的识别率。
  • 一句话识别服务集成了自然语言理解功能,支持对识别出的文字做分析,返回语义结果。
取消 提交回答
全部回答(0)
相关问答

3

回答

语音识别效果比较一般,有什么办法吗?

2022-05-24 17:51:27 1550浏览量 回答数 3

1

回答

天猫精灵AI产品测试中怎样使用语音识别评测呢?

2022-03-15 22:57:40 958浏览量 回答数 1

1

回答

通常语音识别有几种模型?

2021-12-21 12:09:32 275浏览量 回答数 1

1

回答

语音识别服务支持哪些编码格式的音频?

2020-03-27 15:04:31 470浏览量 回答数 1

1

回答

语音识别服务支持方言识别吗?

2020-03-27 15:08:44 605浏览量 回答数 1

1

回答

智能外呼ASR中如何配置英文语音识别模型

2019-03-11 11:57:54 1724浏览量 回答数 1

0

回答

文本转语音 字数限制

2018-11-27 10:37:17 657浏览量 回答数 0

1

回答

[@古散][¥20]语音识别服务会提供音频文件下载吗?

2018-10-31 15:10:05 1912浏览量 回答数 1

0

回答

智能语音交互实时语音识别使用演示

2017-10-26 10:28:24 1534浏览量 回答数 0

0

回答

使用ASR SDK如何发送连续语音数据进行语音识别

2016-06-19 21:47:09 3504浏览量 回答数 0
+关注
716
文章
646
问答
问答排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载