开发者社区 > ModelScope模型即服务 > 正文

modelscope-funasr UniASR语音识别-中文方言-通用-16k-离线 有人用过吗?

modelscope-funasr UniASR语音识别-中文方言-通用-16k-离线 这个有人用过吗?

展开
收起
-Feng、冯冯 2024-01-05 07:58:28 61 0
1 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    UniASR语音识别-中文方言-通用-16k-离线模型是一种2遍刷新(Two pass)的端到端语音识别模型。该模型在10000小时的音视频数据上进行了微调,并使用了词表3445vocab。离线语音识别系统具有较高的识别准确率,但无法实时返回解码文字结果,处理长语音时容易发生解码重复的问题,以及高并发解码超时的问题等。

    这种模型可以满足日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。同时,它可用于中文标点预测,以更正语音识别模型输出文本的标点。

    2024-01-06 11:59:05
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

相关电子书

更多
阿里云总监课第二期——Neural Network Language Model在语音识别中的应用 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载