modelscope-funasr微调时候的数据准备格式是什么样的呢?

modelscope-funasr微调时候的数据准备格式是什么样的呢?是每一条数据一行json对吗?json里的这些字段是什么意思呢?
3c684e4e7e862d8d0f985c4c39030211.png
c2b9613c914ca3479aa8d7699e01b4db.png

展开
收起
嘟嘟嘟嘟嘟嘟 2024-01-05 06:38:40 287 分享 版权
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    FunASR的微调数据准备格式,开发者可以参考在GitHub上的"finetune.py"文件进行修改。这个文件中包含了微调所需的相关设置。同时,如果你使用的是私有数据集进行微调,需要在ModelScope中保留相关模型的名称。此外,确保你的数据集符合FunASR的数据要求,以确保微调过程的顺利进行。

    2024-01-06 13:22:28
    赞同 展开评论
  • 在使用modelscope-funasr进行微调时,数据准备格式需要特定的文件和目录结构。首先,数据集目录需要包括train/wav.scptrain/text两个文件,分别用于存储音频文件路径和对应的文本标注。

    在准备数据时,每一条数据通常占据一行json文件。json文件中的字段表示具体的数据信息。例如,wav.scp文件中的每一行可能包含一个音频文件的绝对路径,对应text文件中的该行的文本标注。

    在微调完成后,您可以使用新的模型来进行语音识别。执行特定命令,可以对音频进行解码推理。请注意,这只是一种常见的做法,实际操作可能需要根据具体情况进行调整。

    2024-01-05 09:31:09
    赞同 展开评论
  • 稍后将在文档中更新微调相关内容。此回答整理自钉群“modelscope-funasr社区交流”

    2024-01-05 09:02:53
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理