开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

在modelscope-funasr基于paraformer微调维语,要生成新的tokenize吗?

在modelscope-funasr基于paraformer微调维语,有必要生成新的tokenizer么?修改了tokenizer的维度,需不需要改模型的config里的某些参数

展开
收起
三分钟热度的鱼 2024-03-13 21:27:00 116 0
1 条回答
写回答
取消 提交回答
  • 你如果只是想训练维语,可以跑一个bpe模型,生成新的tokenizer,替换掉原来的。如果是你想拓展到维语,可以用维语的tokenzier把你的训练测试数据,过一遍,把分词结果加入到seg_dic与tokens.json里面去,网上应该有开源的维语bpe模型。此回答整理自钉群“modelscope-funasr社区交流”

    2024-03-13 21:43:39
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载