ModelScope中 sft微调后,再部署,发现这个问题,这个怎么解呢?

ModelScope中 sft微调后,再部署,发现这个问题,缺少 generation_config.json, 这个怎么解呢?image.png
用 qwen finetune qlora 微调image.png

展开
收起
真的很搞笑 2023-11-01 20:38:29 465 分享 版权
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    generation_config.json 是用于模型微调的一个配置文件,包含了如词汇表大小、起始符等相关的信息。如果您缺少了它,则可能出现一些异常情况。
    要解决这个问题,请检查您是否已经将该文件放在了正确的位置上。如果您忘记了把它放在哪里,请参考以下路径:

    • /opt/models/config/generation_config.json

    如果您仍然找不到文件,请尝试重新下载它并放置在正确的位置。

    2023-11-02 13:42:08
    赞同 展开评论
  • 缺少generation_config.json文件可能是因为在微调(fine-tuning)模型之后,没有正确地保存或配置相关的配置文件。generation_config.json通常包含模型生成文本的配置信息,例如最大生成长度、使用策略等。

    解决这个问题的方法可能包括:

    1. 检查微调过程:确保在微调模型时,使用了正确的配置文件和参数。有些模型需要特定的配置文件来正确地进行生成。你可以查看模型的文档或教程,以获取关于所需配置文件的更多信息。
    2. 保存配置文件:在微调模型后,确保正确地保存了generation_config.json文件。这个文件通常在微调过程中会生成,你需要确保它被正确地保存到了你的项目目录中。
    3. 检查项目结构:确保你的项目目录中包含了正确的文件和文件夹结构。例如,一些模型可能需要特定的文件夹结构,如checkpointconfig等。
    4. 重新生成配置文件:如果以上方法都没有解决问题,你可以尝试重新生成generation_config.json文件。这可以通过使用模型的官方代码库或教程中的命令行工具来实现。
    2023-11-02 09:56:24
    赞同 展开评论
  • 北京阿里云ACE会长

    问题是在加载模型时缺少了一个名为generation_config.json的文件。这个文件通常是在模型预训练过程中由Hugging Face的Transformers库自动生成的。
    要解决这个问题,您可以尝试以下方法:

    1. 确保您的模型已经正确地从Hugging Face Model Hub下载并加载。您可以在web_demo.py文件中的main函数中检查config变量的值,确认它是否是您期望的模型配置。
    2. 如果您的模型没有正确加载,您可能需要重新下载模型。请确保您使用的模型ID是正确的,并检查网络连接以确保可以顺利地下载模型。
    3. 如果模型已经正确加载,但仍然缺少generation_config.json文件,您可以尝试手动创建一个。您可以在GenerationConfig.from_pretrained()函数的文档中找到有关如何创建GenerationConfig对象的详细说明。通常,您需要提供一个包含模型名称、预训练任务和指令的JSON对象。例如:

    {
    "model": "bert-base-chinese",
    "task": "text-generation",
    "instructions": "请生成一段关于人工智能的介绍"
    }
    CopyCopy

    然后,您可以使用这个JSON对象来创建GenerationConfig对象:

    config = GenerationConfig.from_pretrained(json.dumps(generation_config))
    CopyCopy

    请注意,这只是一个示例,您可能需要根据实际情况调整generation_config的值。

    1. 如果以上方法都无法解决问题,您可能需要检查您的系统或代码中是否存在其他问题。错误信息中提到了/mnt/workspace/qwen 7b modify/main,这可能是一个指向模型文件的路径。请确保模型文件存在于正确的位置,且可以被您的代码访问。
    2023-11-02 07:37:40
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理