开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

modelscope语音识别模型,推荐用哪个比较好?

modelscope语音识别模型,推荐用哪个比较好?

展开
收起
小小爱吃香菜 2024-01-09 22:15:21 123 0
1 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在阿里云的ModelScope社区,达摩院语音实验室开源了工业级的语音识别模型,这些模型涵盖了语音识别、语音合成、语音唤醒、语音信号处理和口语语音处理五大方向的超过50个模型。其中,语音识别模型是基于三类主流模型构建的,包括CTC、Attention-based 和 RNN-Transducer。具体来说,您可以根据实际应用场景和需求来选择最适合的模型。例如,如果您需要对中文语音进行高准确度的转录,那么可以考虑使用中文模型。同时,这些模型支持本地部署和使用,非常方便实用。

    2024-01-13 18:49:37
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载