在modelscope-funasr为什么设置了这个之后,转录结果中的数字还是中文的?

在modelscope-funasr为什么设置了--itn-dir thuduj12/fst_itn_zh 之后,转录结果中的数字还是中文的?

展开
收起
三分钟热度的鱼 2024-01-17 18:46:38 610 分享 版权
阿里云 AI 助理回答

在使用 modelscope-funasr 时,即使设置了 --itn-dir thuduj12/fst_itn_zh 参数,转录结果中的数字仍然是中文的原因可能与以下几个方面有关:

1. ITN规则未正确加载

  • --itn-dir 参数用于指定逆文本归一化(Inverse Text Normalization, ITN)的规则目录。如果该目录下的规则文件未正确加载或路径配置有误,ITN 功能将无法正常工作。
  • 解决方法:请确保 thuduj12/fst_itn_zh 路径是正确的,并且包含有效的 ITN 规则文件。可以通过检查日志输出确认规则是否成功加载。

2. 模型输出未启用 ITN 处理

  • 即使指定了 --itn-dir 参数,FunASR 的某些模型可能默认不启用 ITN 处理。需要在调用模型时显式启用 ITN 功能。
  • 解决方法:在运行命令中添加相关参数以启用 ITN。例如:
    python your_script.py --itn-dir thuduj12/fst_itn_zh --enable-itn true
    

    具体参数名称和用法需参考 FunASR 的官方文档。

3. ITN规则不匹配

  • ITN 规则可能未覆盖所有场景,尤其是针对中文数字的处理。如果规则文件中缺少对特定数字格式的支持,转录结果中的数字仍会保持原始形式。
  • 解决方法:检查 thuduj12/fst_itn_zh 目录下的规则文件,确认其是否包含对中文数字的转换规则。如果规则不足,可以尝试更新或扩展规则文件。

4. 模型输出后处理未生效

  • FunASR 的转录结果可能经过多层后处理,ITN 只是其中的一部分。如果其他后处理步骤覆盖了 ITN 的结果,也可能导致数字未被正确转换。
  • 解决方法:检查模型的后处理流程,确保 ITN 是最后一个生效的步骤。可以通过调试或日志输出验证每一步的处理结果。

5. 输入数据格式问题

  • 如果输入音频中的数字发音不标准或存在歧义,ITN 规则可能无法正确识别并转换为阿拉伯数字。
  • 解决方法:确保输入音频的质量较高,并尽量避免模糊或非标准的数字发音。

总结建议

为了进一步排查问题,请按照以下步骤操作: 1. 确认 --itn-dir 参数指向的路径和规则文件是否正确。 2. 检查是否显式启用了 ITN 功能。 3. 验证 ITN 规则文件是否覆盖了中文数字的转换场景。 4. 检查模型的后处理流程,确保 ITN 结果未被覆盖。

如果问题仍未解决,建议参考 FunASR 的官方文档或社区支持获取更详细的指导。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

还有其他疑问?
咨询AI助理