开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

在ModelScope中,想问问有没有实时语言识别的好用的模型

想问问有没有实时语言识别的好用的模型

展开
收起
崔问问 2023-12-03 22:46:04 103 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在ModelScope中,存在几款优秀的实时语言识别模型。例如,UniASR模型是一种两遍刷新的端到端语音识别模型,它能够以高精准度实时进行语音识别。另一个值得推荐的模型是Paraformer中文通用语音识别模型,它是通过工业级数万小时的标注音频进行训练的,具有很好的通用识别效果,可以广泛应用于语音输入法、语音导航、智能会议纪要等场景。此外,WeNet中采用的U2模型也是一款性能出色的实时语言识别模型,它使用Joint CTC/AED的结构进行训练,并通过dynamic chunk的训练技巧使Shared Encoder能够处理长序列。你可以根据自己的实际需求和应用场景,选择最适合的模型。

    2023-12-04 15:53:47
    赞同 展开评论 打赏
  • 在ModelScope中,存在一些优秀的实时语言识别模型。例如,UniASR模型是一种两遍刷新的端到端语音识别模型,它不仅识别精度高,而且能实时进行语音识别。另一个值得推荐的模型是Paraformer中文通用语音识别模型,这个模型使用了工业级数万小时的标注音频进行训练,具有很好的通用识别效果,可以应用于语音输入法、语音导航、智能会议纪要等场景。此外,阿里还在ModelScope上开放了涉及不同模型结构(如UniASR,Paraformer)、不同模型大小(如small,large)以及不同语种(如中文,英文,中英自由说,日语,俄语,印尼语等)的阿里工业级的语音识别模型。因此,你可以根据你的具体需求和场景来选择合适的模型。

    2023-12-04 14:25:17
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载