开发者社区> 问答> 正文

一句话识别是什么?



功能介绍


一句话识别:即实时短语音识别,可用于语音输入法、智能客服等领域。

  • 支持语言包括:汉语普通话,东北、河南、四川等方言,粤语,英语
  • 支持音频格式:PCM/WAV/SPEEX/OPUS
  • 支持结果返回方式包括:“流式”和“非流式”两种模式
  • 提供Java、Android、iOS、C++ 等平台的SDK。
  • 支持用户自定义热词功能。


选择app_key


语音识别服务根据用户场景抽象出若干模型,如智能客服、社交聊天等。使用正确的模型可以显著提高语音识别准确率。「一句话识别」通过app_key参数指定需要使用的模型,用户可针对具体的使用场景选择。
== 选择时请务必保证语音数据的采样率要与 app_key一致 ==
app_key语音数据格式领域
nls-service-realtime-8k8kHz采样率智能客服服务领域,比如电话客服等
nls-service16kHz采样率社交聊天
nls-service-streaming16kHz采样率社交聊天
nls-service-tv16kHz采样率家庭娱乐
nls-service-shopping16kHz采样率电商购物领域
nls-service-care16kHz采样率智能客服服务领域
nls-service-multi-domain16kHz采样率短视频,视频直播领域,教育,娱乐,文学,法律,财经等
nls-service-fangyan-opus16kHz采样率 opus格式支持东北、河南、四川等方言
nls-service-yue-opus16kHz采样率 opus格式粤语
nls-service-yue-streaming16kHz采样率粤语
nls-service-en-opus16kHz采样率 opus格式英语
nls-service-en-streaming16kHz采样率英语

以上所列app_key也可以在调用「 语音合成」服务时使用。
注:
(1) “支持的结果返回方式”包括“流式”和“非流式”两种模式,“流式”模式下用户一边说话一边返回识别结果,“非流式”简单来说就是用户整句话说完后返回识别结果。具体设置方式请见API说明
(2) 语音数据采样位数(或称采样精度、量化级)必须为 16bit

展开
收起
nicenelly 2017-10-25 15:02:38 1981 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载