文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

在ModelScope中，想问问有没有实时语言识别的好用的模型

想问问有没有实时语言识别的好用的模型

展开

收起

崔问问 2023-12-03 22:46:04 362 版权

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在ModelScope中，存在几款优秀的实时语言识别模型。例如，UniASR模型是一种两遍刷新的端到端语音识别模型，它能够以高精准度实时进行语音识别。另一个值得推荐的模型是Paraformer中文通用语音识别模型，它是通过工业级数万小时的标注音频进行训练的，具有很好的通用识别效果，可以广泛应用于语音输入法、语音导航、智能会议纪要等场景。此外，WeNet中采用的U2模型也是一款性能出色的实时语言识别模型，它使用Joint CTC/AED的结构进行训练，并通过dynamic chunk的训练技巧使Shared Encoder能够处理长序列。你可以根据自己的实际需求和应用场景，选择最适合的模型。

2023-12-04 15:53:47

赞同展开评论
sunrr

在ModelScope中，存在一些优秀的实时语言识别模型。例如，UniASR模型是一种两遍刷新的端到端语音识别模型，它不仅识别精度高，而且能实时进行语音识别。另一个值得推荐的模型是Paraformer中文通用语音识别模型，这个模型使用了工业级数万小时的标注音频进行训练，具有很好的通用识别效果，可以应用于语音输入法、语音导航、智能会议纪要等场景。此外，阿里还在ModelScope上开放了涉及不同模型结构（如UniASR，Paraformer）、不同模型大小（如small，large）以及不同语种（如中文，英文，中英自由说，日语，俄语，印尼语等）的阿里工业级的语音识别模型。因此，你可以根据你的具体需求和场景来选择合适的模型。

2023-12-04 14:25:17

赞同展开评论

相关问答

modelscope-funasr能识别传入语言的语种吗？

227

0

0

modelscope-funasr的sensevoice我看写的支持50中语言，具体在哪可以看到？

383

0

0

modelscope-funasr指定不了语言种类为什么？

250

1

0

ModelScope模型可以转JAVA语言调用的？

270

0

0

modelscope-funasr中想要支持一种新的语言，应该要修改tokenize吧？

319

0

0

ModelScope中FRCRN语音降噪-单麦-16k如何能输入语言流，然后输入语音流？

619

1

0

modelscope-funasr这个模型现在能加进去吗？

603

3

0

modelscope-funasr微调模型报这个错是什么原因哈？

214

1

0

ModelScope中模型下载到本地进行测试的时候报错怎么办？

447

1

0

在ModelScope中，如何设置模型加载时的数据类型（dtype）？

345

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

一线互联 × Rokid AI眼镜：为什么它是工业4.0时代一线人员的标准装备？

Ж-CEH：锚定结构存在论—— 从宇宙虚无到视觉张量的统一框架

AI短剧/AI广告生成实战流程：阿里云百炼新上线的HappyHorse 1.1功能详解、参数调试、成本指南

历史科普视频的AI自动化生产工作流：从全手动到半自动的工程演进

测试一下发文章

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

AI 视频翻译：打破语言壁垒，连接全球观众

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

请问Modelscope互联网如何访问Notebook的服务呢？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope这个免费额度可以在哪里查询啊？

我想问下ModelScope数据集的数据怎么获取？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope模型是咋收费的, 是按机器每小时收费嘛？

ModelScope怎么下载模型文件？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

StoryWeaver：故事可视化生成模型，快速生成故事绘本，支持处理单角色和多角色的故事可视化任务

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

See3D：智源研究院开源的无标注视频学习 3D 生成模型

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

FlashVideo：生成1080p视频仅需102秒，字节联合港大推出低成本高分辨率视频生成框架

LTX Video：Lightricks推出的开源AI视频生成模型

展开全部

还有其他疑问?