UniASR如何进行流式语音识别?

如何使用 UniASR语音识别-中文-通用-16k-实时 这个模型进行流式的语音识别呢?api调用范例是进行一句话识别的吧。

展开
收起
游客jfij4tsw2hn4m 2023-01-11 16:17:56 1432 分享 版权
1 条回答
写回答
取消 提交回答
  • UniASR模型是一种2遍刷新模型(Two pass)端到端语音识别模型。在流式业务场景中,为了更好的折中实时性与准确率,往往采用多个不同时延的模型系统。为了满足差异化业务场景对计算复杂度、实时性和准确率的要求,常用的做法是维护多种语音识别系统,例如,CTC系统、E2E离线系统、SCAMA流式系统等。 image.png

    2023-01-12 23:27:45
    赞同 展开评论

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

收录在圈子:
+ 订阅

热门讨论

热门文章

还有其他疑问?
咨询AI助理