在modelscope-funasr为什么设置了--itn-dir thuduj12/fst_itn_zh 之后,转录结果中的数字还是中文的?
在使用 modelscope-funasr 时,即使设置了 --itn-dir thuduj12/fst_itn_zh 参数,转录结果中的数字仍然是中文的原因可能与以下几个方面有关:
--itn-dir 参数用于指定逆文本归一化(Inverse Text Normalization, ITN)的规则目录。如果该目录下的规则文件未正确加载或路径配置有误,ITN 功能将无法正常工作。thuduj12/fst_itn_zh 路径是正确的,并且包含有效的 ITN 规则文件。可以通过检查日志输出确认规则是否成功加载。--itn-dir 参数,FunASR 的某些模型可能默认不启用 ITN 处理。需要在调用模型时显式启用 ITN 功能。python your_script.py --itn-dir thuduj12/fst_itn_zh --enable-itn true
具体参数名称和用法需参考 FunASR 的官方文档。
thuduj12/fst_itn_zh 目录下的规则文件,确认其是否包含对中文数字的转换规则。如果规则不足,可以尝试更新或扩展规则文件。为了进一步排查问题,请按照以下步骤操作: 1. 确认 --itn-dir 参数指向的路径和规则文件是否正确。 2. 检查是否显式启用了 ITN 功能。 3. 验证 ITN 规则文件是否覆盖了中文数字的转换场景。 4. 检查模型的后处理流程,确保 ITN 结果未被覆盖。
如果问题仍未解决,建议参考 FunASR 的官方文档或社区支持获取更详细的指导。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352