热门
modelscope-funasr使用的场景有很多专业领域词汇短语,如何提高识别正确率?有什么建议?
针对特定领域的语音数据进行收集和整理,构建一个涵盖这些专业词汇和短语的高质量、有代表性的训练集。 对模型进行领域特定的数据增强,如添加噪声、改变音调和速度等,以模拟真实环境中的变异性。 使用该领域数据对模型进行微调(finetune),让模型能够学习并适应专业词汇的发音特点。
先试试热词,如果搞不定就finetune ,此回答整理自钉群“modelscope-funasr社区交流”
包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域