如何把阿里语音AI 平台的公版音色,对接到我们的平台上?
语音识别服务,可提供语音转文本服务,包括:一句话识别、实时语音识别、录音文件识别。同时,还提供用户自定义热词接口,提高特定领域的识别率。一句话识别:即实时短语音识别,可提供Java、Android、iOS SDK、C++ SDK。实时语音识别:即实时长语音识别,可支持长时间语音识别。可提供Java SDK、C++ SDK。录音文件识别:可提供RESTful接口,支持录音文件的语音识别。阿里云语音服务为用户提供语音识别的基础服务,Android、iOS SDK封装了录音(Recoder)、静音检测(VAD)、语音服务访问(WSAPI)等功能,可以极大的简化App开发。阿里云语音识别技术是基于后台服务器的密集CPU计算,语音SDK负责在App端打开录音机,进行语音压缩后,传送到服务器端。服务器进行语音识别转成文字后,通常还需要进行自然语言处理,分析其语法结构,并把语意结果返回给SDK。
赞0
踩0