文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr如果想让模型同时具备中文、英文能力是不是不能用这个预训练模型？

iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 这个模型使用的tokenizer 是CharTokenizer
那比如如果我想微调同时具备英文和中文能力时，这个地方英文也变成了一个字母一个字母的token话了。所以在modelscope-funasr 如果想让模型同时具备中文、英文能力是不是不能用这个预训练模型？或者说可不可以换 tokenizer？

展开

收起

三分钟热度的鱼 2024-03-27 17:00:27 573 版权

2 条回答

写回答

取消提交回答

mrq4nk6ni2neg

可以使用modelsce-funasr预训练模型进行中英文的语音识别，并且可以更换tokenizer。

modelscope-funasr是阿里巴巴提供的一个端到端的语音识别工具包，旨在为研究人员和开发人员在学术研究和工业应用之间架设桥梁。它支持多种语言，包括中文和英文，因此具备同时处理这两种语言的能力。ModelScope平台上也提供了多种不同大小、不同语种的模型供用户选择和使用。

关于iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch这个模型使用的tokenizer，它是以字符为单位进行分词的CharTokenizer。这种分词方式对于中文来说十分合适，因为中文写作不像英文那样由空格分隔单词。但是对于英文来说，这可能会导致将每个字母作为一个独立的token，这并非最佳做法。

在modelscope-funasr中，如果想要支持新的语言或者修改现有的语言处理能力，可以通过修改tokenizer来实现。比如拓展到维吾尔语，就可以使用相应的bpe模型生成新的tokenizer，并替换掉原来的tokenizer。同样地，如果需要支持中英文混合识别，理论上也是可以更换一个适合中英文的tokenizer，或者对现有tokenizer进行适当修改来达到目的。

综上所述，虽然modelscope-funasr提供的预训练模型默认使用的是CharTokenizer，但用户可以根据自己的需求更换或定制tokenizer，从而实现想要的中英文混合语音识别功能。

2024-03-31 09:25:12

赞同展开评论
圆不溜秋的小猫猫

这个搞错了，正常走上面。
此回答整理自钉群“modelscope-funasr社区交流”

2024-03-27 17:17:46

赞同 1 展开评论

相关问答

对modelscope的实体命名预训练模型进行微调上出现错误

485

1

0

ModelScope中使用开源的千问1_8预训练模型微调后测试模型的时候报错，怎么解决？

468

0

0

modelscope的 StructBERT的中文Base预训练模型有关系吗？

252

0

0

ModelScope中damofd_34G_kps预训练模型如何下载呢？

185

0

0

官方ModelScope是没有对qwen模型进行“二次预训练”的文档吗？

174

1

0

需求是对qwen1.5-14B-chat进行二次预训练，有没有相关ModelScope文档？

250

1

0

ModelScope中，instruct数据不好构造，是不是可以继续预训练？大概需要多少数据量？

283

1

0

请问modelscope的samberthifigan语音合成多人预训练24K，要怎么更换发音人？

299

1

0

modelscope模型的最大token 能通过预训练整大点吗?

161

1

0

链接中的modelscope预训练是不是不需要query，就是扔给模型一大堆的训练语料就可以？

175

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

AI元认知雏形

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

相关解决方案

更多

基于 Spark 和 PyTorch 的模型训练方案

一键训练模型及部署GPU共享推理服务

GLM-5.2：长任务时代开源旗舰模型

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

热门讨论

热门文章

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

如何修改通义千问的system prompt，以修改自定义名字

运行官方示例在win环节下conda中报错

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr 热词如何设置？

为啥都不能很好的处理文本鉴黄

如何下载llama模型到本地？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr如何释放显存呢？

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

通古大模型：古籍研究者狂喜！华南理工开源文言文GPT：AI自动断句+写诗翻译，24亿语料喂出来的学术神器

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

展开全部

还有其他疑问?