备案控制台

开发者社区 ModelScope模型即服务正文

推理时候报错，说没有图中modelscope文件，怎么处理？

"推理时候报错，说没有图中modelscope文件，怎么处理？

!/bin/bash

分布式，训练指定显卡

export CUDA_DEVICE_MAX_CONNECTIONS=1
DIR=pwd

export CUDA_VISIBLE_DEVICES=1,2,3

GPUS_PER_NODE=3
NNODES=1
NODE_RANK=0
MASTER_ADDR=localhost
MASTER_PORT=6001

MODEL=""Qwen/Qwen-VL-Chat-Int4"" # Qwen/Qwen-VL-Chat-Int4 Set the path if you do not want to load from huggingface directly

ATTENTION: specify the path to your training data, which should be a json file consisting of a list of conversations.

See the section for finetuning in README for more information.

DATA=""data/train_data.json""

DISTRIBUTED_ARGS=""
--nproc_per_node $GPUS_PER_NODE \
--nnodes $NNODES \
--node_rank $NODE_RANK \
--master_addr $MASTER_ADDR \
--master_port $MASTER_PORT
""

Remember to use --fp16 instead of --bf16 due to autogptq

torchrun $DISTRIBUTED_ARGS finetune.py \
--model_name_or_path $MODEL \
--data_path $DATA \
--fp16 True \
--fix_vit True \
--output_dir output_qlora_model \
--num_train_epochs 5 \
--per_device_train_batch_size 2 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 8 \
--evaluation_strategy ""no"" \
--save_strategy ""steps"" \
--save_steps 50 \
--save_total_limit 10 \
--learning_rate 1e-5 \
--weight_decay 0.1 \
--adam_beta2 0.95 \
--warmup_ratio 0.01 \
--lr_scheduler_type ""cosine"" \
--logging_steps 1 \
--report_to ""none"" \
--model_max_length 2048 \
--lazy_preprocess True \
--use_lora \
--q_lora \
--gradient_checkpointing \
--deepspeed finetune/ds_config_zero2.json"

展开

收起

小小爱吃香菜 2024-05-29 08:43:36 90 版权

1 条回答

写回答

取消提交回答

为了利利

您参考这个文档微调，learning_rate正常，推理也正常，参考以下链接 https://github.com/modelscope/swift/blob/main/docs/source/Multi-Modal/qwen-vl%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-05-29 10:31:56

赞同展开评论

相关问答

llamaindex整合modelscope本地模型，启动报错

461

1

0

modelscope这个报错呢怎么回事？在参数里加上encoding=utf-8，又会出现这个报错

123

1

0

modelscope-funasr执行sencevoice后报错怎么解决？

117

0

0

在modelscope-funasr为了实现体验Demo这种效果，还需要怎样修改py文件？

125

1

0

modelscope-funasr这个报错是什么问题？

93

1

0

modelscope里做了个简单的例子，出现报错怎么处理呀？

153

1

0

在modelscope-funasr中finetune.sh脚本，中间报错如何解决？

94

0

0

在modelscope-funasr中模型换成Whisper 会报错，不能用这个模型吗？

125

0

0

ModelScope 使用mossformer的训练代码出现如下报错，该如何解决啊？

150

1

0

ModelScope最新的CPU-docker镜像启动报错，咋解决呢？

148

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

亚马逊获取商品评论的API接口

亚马逊平台根据关键字搜索商品API接口

企业微信ipad协议：从二进制流到业务指令的拆解

1688拍立淘API实战指南：以图搜货解锁B2B采购新效率

去中心化应用合约开发安全实操全流程

热门讨论

热门文章

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

com/action/joingroup?code=v1是什么意思

我希望通过damo-YOLO训练1500*1500的图片

从modelscope下载模型失败，怎么回事？

ModelScope下载速度慢怎么解决？

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

modelscope-funasr模型选择whisper large v3，不出时间戳是正常的吗？

展开全部

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

仅100多元，他给视障人群装上AI“眼睛”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

展开全部

还有其他疑问?