备案控制台

开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

modelscope语音识别模型，推荐用哪个比较好？

modelscope语音识别模型，推荐用哪个比较好？

展开

收起

小小爱吃香菜 2024-01-09 22:15:21 89 0

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在阿里云的ModelScope社区，达摩院语音实验室开源了工业级的语音识别模型，这些模型涵盖了语音识别、语音合成、语音唤醒、语音信号处理和口语语音处理五大方向的超过50个模型。其中，语音识别模型是基于三类主流模型构建的，包括CTC、Attention-based 和 RNN-Transducer。具体来说，您可以根据实际应用场景和需求来选择最适合的模型。例如，如果您需要对中文语音进行高准确度的转录，那么可以考虑使用中文模型。同时，这些模型支持本地部署和使用，非常方便实用。

2024-01-13 18:49:37

赞同展开评论打赏

相关问答

在modelscope-funasr用英文模型识别英文，老是蹦跶几个中文出来，为什么？

25

1

0

modelscope-funasr的实时语音识别API详情，过程的结果非常不准，这是什么原因呢？

17

1

0

modelscope中，阿里的读光OCR模型，参数是多少呀？

32

1

0

智能语音交互实时语音识别python SDK子训练模型如何设置模型ID

14

1

0

怎么在modelscope-funasr中切换要使用的模型呢？damo中只有5个模型，能从ModeS

11

0

0

modelscope-funasr这个websocket接入自己的语音识别应用怎么大多数没有返回？

21

0

0

ModelScope中，多久保存一次训练模型？

17

1

0

ModelScope中，swift只能合并完模型再量化吗？不是同时进行吗？

10

1

0

modelscope-funasr离线中文语音识别C++版本，有对音频的长度做限制吗？

49

0

0

ModelScope通过对大模型进行微调，微调数据为2万条专业知识，对这方面有什么研究心得？

62

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

服务器上onnxruntime-gpu 调用结束，如何释放显存

Modelscope魔塔的创空间的文件怎么下载到本地呀？

streamlit 生成链接无法访问，gradio只生成内网，无法生成公网

ModelScope中，请问Qwen-14B-Chat-Int4运行最少需要多少内存？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

ModelScope 使用14B模型推理时报这个错误？

请问modelscope中，有一个依赖，kantts，要怎么安装？

展开全部

modelscope调用的模型如何指定在特定gpu上运行？排除使用CUDA_VISIBLE_DEVICES环境变量

Stable Diffusion 介绍与入门

关键点检测从入门到进阶

人像卡通化

视觉AI技术体系及趋势概述

图像分类基础与实战

达摩院OpenVI-视频目标跟踪ICASSP 2023 Oral 渐进式上下文Transformer跟踪器 ProContEXT

ModelScope模型使用与EAS部署调用

Stable Diffusion使用窍门

展开全部

相关课程

更多

ModelScope社区Library技术架构介绍

174

1

去学习

达摩院智能语音交互 - 人机对话技术浅析

100

4

去学习

达摩院智能语音交互 - 声纹识别技术

2764

4

去学习

阿里巴巴智能语音交互技术与应用

7096

7

去学习

达摩院智能语音交互 - 语音识别技术

214

4

去学习

达摩院智能语音交互 - 语音合成技术

427

4

去学习

相关电子书

更多

阿里云总监课第二期——IoT时代的语音交互智能 立即下载

阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载

智能语音交互：阿里巴巴的研究与实践 立即下载