modelscope-funasr中带热词的模型是怎么微调? 比如这个https://modelscope.cn/models/damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404/summary
在ModelScope中,damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404
是一个支持热词功能的语音识别模型。以下是关于如何微调该模型以支持热词功能的详细步骤和说明:
热词功能通过在语音识别过程中引入特定领域的关键词(如人名、公司名称或专有名词),提升这些词汇的识别准确率。根据知识库中的描述,热词组设置后无需训练即可生效,只需在语音转文字时选择对应的热词组即可使用。
重要提醒: - 热词只能包含汉字,数字需转换为汉字形式(例如“58.9元”需改为“五十八点九元”)。 - 每个热词最多不超过10个字,每个热词组最多包含128个热词。 - 如果语音识别模型在90天内未被使用,系统会自动回收,请妥善维护。
虽然热词功能本身无需训练即可生效,但为了进一步优化模型在特定场景下的表现,可以通过微调的方式增强模型对热词的敏感度。以下是具体操作步骤:
收集热词相关数据
根据业务需求,整理包含热词的语音数据和对应的文本标注。例如,如果热词是“王晓铭”,则需要收集包含该名字的语音片段及其正确转录文本。
格式化数据集
数据集应按照模型要求的格式进行组织。参考知识库中的示例,可以将数据集格式化为JSON文件,其中每条记录包含语音文件路径和对应的文本标注。
新建热词组
在智能对话分析平台中,进入“语音模型训练工具”的热词模型模块,点击“新建热词组”按钮,填写热词组名称并添加热词。
验证热词效果
在语音转文字任务中选择新建的热词组,测试热词是否能够有效提升识别准确率。如果效果不理想,可调整热词内容或重新创建热词组。
下载基础模型
使用ModelScope提供的API或工具下载damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404
模型。例如,执行以下代码:
from modelscope.hub.snapshot_download import snapshot_download
snapshot_download('damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404', cache_dir='.', revision='master')
加载数据集并启动微调
使用LLaMA Factory或其他微调工具,加载准备好的数据集并启动微调流程。关键参数配置如下:
1e-4
。bf16
或fp16
。2
。启动Web UI进行可视化操作
如果需要更直观的操作界面,可以启动LLaMA Factory的Web UI工具,通过图形化界面完成参数配置和微调任务提交:
export USE_MODELSCOPE_HUB=1 && \
llamafactory-cli webui
测试热词识别能力
使用微调后的模型对包含热词的语音数据进行测试,评估热词识别的准确率。
调整微调策略
如果热词识别效果仍不理想,可以尝试增加热词相关的训练数据,或调整微调参数(如学习率、LoRA作用模块等)。
通过上述步骤,您可以成功微调damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404
模型,使其在特定场景下更好地支持热词功能。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352