一句话识别是什么?-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

一句话识别是什么?

nicenelly 2017-11-01 10:12:24 1925


功能介绍


一句话识别:即实时短语音识别,可用于语音输入法、智能客服等领域。
  • 支持语言包括:汉语普通话,东北、河南、四川等方言,粤语,英语
  • 支持音频格式:PCM/WAV/SPEEX/OPUS
  • 支持结果返回方式包括:“流式”和“非流式”两种模式
  • 提供Java、Android、iOS、C++ 等平台的SDK。
  • 支持用户自定义热词功能。


选择app_key


语音识别服务根据用户场景抽象出若干模型,如智能客服、社交聊天等。使用正确的模型可以显著提高语音识别准确率。「一句话识别」通过app_key参数指定需要使用的模型,用户可针对具体的使用场景选择。
== 选择时请务必保证语音数据的采样率要与 app_key一致 ==
app_key语音数据格式领域
nls-service-realtime-8k8kHz采样率智能客服服务领域,比如电话客服等
nls-service16kHz采样率社交聊天
nls-service-streaming16kHz采样率社交聊天
nls-service-tv16kHz采样率家庭娱乐
nls-service-shopping16kHz采样率电商购物领域
nls-service-care16kHz采样率智能客服服务领域
nls-service-multi-domain16kHz采样率短视频,视频直播领域,教育,娱乐,文学,法律,财经等
nls-service-fangyan-opus16kHz采样率 opus格式支持东北、河南、四川等方言
nls-service-yue-opus16kHz采样率 opus格式粤语
nls-service-yue-streaming16kHz采样率粤语
nls-service-en-opus16kHz采样率 opus格式英语
nls-service-en-streaming16kHz采样率英语

以上所列app_key也可以在调用「 语音合成」服务时使用。
注:
(1)“支持的结果返回方式”包括“流式”和“非流式”两种模式,“流式”模式下用户一边说话一边返回识别结果,“非流式”简单来说就是用户整句话说完后返回识别结果。具体设置方式请见API说明
(2) 语音数据采样位数(或称采样精度、量化级)必须为 16bit
自然语言处理 Java BI 视频直播 API 语音技术 开发工具 Android开发 iOS开发 内存技术
分享到
取消 提交回答
全部回答(0)
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

推荐文章
相似问题
推荐课程