在modelscope-funasr为什么设置了这个之后，转录结果中的数字还是中文的？

在modelscope-funasr为什么设置了--itn-dir thuduj12/fst_itn_zh 之后，转录结果中的数字还是中文的？

展开

收起

三分钟热度的鱼 2024-01-17 18:46:38 610 版权

阿里云 AI 助理回答

在使用 modelscope-funasr 时，即使设置了 --itn-dir thuduj12/fst_itn_zh 参数，转录结果中的数字仍然是中文的原因可能与以下几个方面有关：

--itn-dir 参数用于指定逆文本归一化（Inverse Text Normalization, ITN）的规则目录。如果该目录下的规则文件未正确加载或路径配置有误，ITN 功能将无法正常工作。
解决方法：请确保 thuduj12/fst_itn_zh 路径是正确的，并且包含有效的 ITN 规则文件。可以通过检查日志输出确认规则是否成功加载。

即使指定了 --itn-dir 参数，FunASR 的某些模型可能默认不启用 ITN 处理。需要在调用模型时显式启用 ITN 功能。
解决方法：在运行命令中添加相关参数以启用 ITN。例如：
```
python your_script.py --itn-dir thuduj12/fst_itn_zh --enable-itn true
```
具体参数名称和用法需参考 FunASR 的官方文档。

ITN 规则可能未覆盖所有场景，尤其是针对中文数字的处理。如果规则文件中缺少对特定数字格式的支持，转录结果中的数字仍会保持原始形式。
解决方法：检查 thuduj12/fst_itn_zh 目录下的规则文件，确认其是否包含对中文数字的转换规则。如果规则不足，可以尝试更新或扩展规则文件。

为了进一步排查问题，请按照以下步骤操作： 1. 确认 --itn-dir 参数指向的路径和规则文件是否正确。 2. 检查是否显式启用了 ITN 功能。 3. 验证 ITN 规则文件是否覆盖了中文数字的转换场景。 4. 检查模型的后处理流程，确保 ITN 结果未被覆盖。

如果问题仍未解决，建议参考 FunASR 的官方文档或社区支持获取更详细的指导。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问