在modelscope-funasr基于paraformer微调维语,有必要生成新的tokenizer么?修改了tokenizer的维度,需不需要改模型的config里的某些参数
你如果只是想训练维语,可以跑一个bpe模型,生成新的tokenizer,替换掉原来的。如果是你想拓展到维语,可以用维语的tokenzier把你的训练测试数据,过一遍,把分词结果加入到seg_dic与tokens.json里面去,网上应该有开源的维语bpe模型。此回答整理自钉群“modelscope-funasr社区交流”