modelscope-funasr中带热词的模型是怎么微调? 

展开
收起
三分钟热度的鱼 2024-01-17 18:34:45 143 分享 版权
阿里云 AI 助理回答

在ModelScope中,damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404 是一个支持热词功能的语音识别模型。以下是关于如何微调该模型以支持热词功能的详细步骤和说明:


1. 热词功能的基本原理

热词功能通过在语音识别过程中引入特定领域的关键词(如人名、公司名称或专有名词),提升这些词汇的识别准确率。根据知识库中的描述,热词组设置后无需训练即可生效,只需在语音转文字时选择对应的热词组即可使用。

重要提醒: - 热词只能包含汉字,数字需转换为汉字形式(例如“58.9元”需改为“五十八点九元”)。 - 每个热词最多不超过10个字,每个热词组最多包含128个热词。 - 如果语音识别模型在90天内未被使用,系统会自动回收,请妥善维护。


2. 微调带热词功能的模型

虽然热词功能本身无需训练即可生效,但为了进一步优化模型在特定场景下的表现,可以通过微调的方式增强模型对热词的敏感度。以下是具体操作步骤:

步骤一:准备数据集

  1. 收集热词相关数据
    根据业务需求,整理包含热词的语音数据和对应的文本标注。例如,如果热词是“王晓铭”,则需要收集包含该名字的语音片段及其正确转录文本。

  2. 格式化数据集
    数据集应按照模型要求的格式进行组织。参考知识库中的示例,可以将数据集格式化为JSON文件,其中每条记录包含语音文件路径和对应的文本标注。

步骤二:配置热词组

  1. 新建热词组
    在智能对话分析平台中,进入“语音模型训练工具”的热词模型模块,点击“新建热词组”按钮,填写热词组名称并添加热词。

  2. 验证热词效果
    在语音转文字任务中选择新建的热词组,测试热词是否能够有效提升识别准确率。如果效果不理想,可调整热词内容或重新创建热词组。

步骤三:微调模型

  1. 下载基础模型
    使用ModelScope提供的API或工具下载damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404模型。例如,执行以下代码:

    from modelscope.hub.snapshot_download import snapshot_download
    snapshot_download('damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404', cache_dir='.', revision='master')
    
  2. 加载数据集并启动微调
    使用LLaMA Factory或其他微调工具,加载准备好的数据集并启动微调流程。关键参数配置如下:

    • 微调方法:推荐使用LoRA(轻量化微调方法),以节约显存。
    • 学习率:建议设置为1e-4
    • 计算类型:根据GPU型号选择bf16fp16
    • 梯度累计:建议设置为2
  3. 启动Web UI进行可视化操作
    如果需要更直观的操作界面,可以启动LLaMA Factory的Web UI工具,通过图形化界面完成参数配置和微调任务提交:

    export USE_MODELSCOPE_HUB=1 && \
    llamafactory-cli webui
    

步骤四:验证微调效果

  1. 测试热词识别能力
    使用微调后的模型对包含热词的语音数据进行测试,评估热词识别的准确率。

  2. 调整微调策略
    如果热词识别效果仍不理想,可以尝试增加热词相关的训练数据,或调整微调参数(如学习率、LoRA作用模块等)。


3. 注意事项

  • 热词优先级:热词功能可能会对其他词汇的识别产生一定干扰,因此需要合理设置热词组,避免过度依赖热词。
  • 模型部署:微调完成后,需将模型重新部署到生产环境,并确保服务具有公网访问权限(如需通过URL调用)。
  • 资源需求:微调过程需要较高的计算资源,建议使用V100或更高显存的GPU实例。

通过上述步骤,您可以成功微调damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404模型,使其在特定场景下更好地支持热词功能。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理