备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope麻烦请看一下这个？

ModelScope麻烦请看一下这个？

展开

收起

真的很搞笑 2023-09-12 19:54:14 122 版权

1 条回答

写回答

取消提交回答

芯在这

没问题啊

Experimental environment: 2 * A100

nproc_per_node=2
CUDA_VISIBLE_DEVICES=0,1 \
torchrun \
--nproc_per_node=$nproc_per_node \
--master_port 29500 \
src/llm_sft.py \
--model_type qwen-7b-chat \
--sft_type lora \
--template_type chatml \
--dtype bf16 \
--output_dir runs \
--ddp_backend nccl \
--dataset wlgb-zh \
--dataset_sample -1 \
--num_train_epochs 10 \
--max_length 1024 \
--lora_rank 8 \
--lora_alpha 32 \
--lora_dropout_p 0.05 \
--lora_target_modules c_attn c_proj \
--gradient_checkpointing false \
--batch_size 1 \
--weight_decay 0. \
--learning_rate 1e-4 \
--gradient_accumulation_steps $(expr 16 / $nproc_per_node) \
--max_grad_norm 0.5 \
--warmup_ratio 0.03 \
--eval_steps 100 \
--save_steps 100 \
--save_total_limit 2 \
--logging_steps 10 \
--use_flash_attn true \
--push_to_hub false \
--hub_model_id qwen-7b-chat-lora \
--hub_private_repo true \
--hub_token 'your-sdk-token' \
如果数据集多的话, --num_train_epochs 10 \ 你自己调整一下就好啦，此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-09-13 07:48:50

赞同展开评论

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83863

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3807

1

0

重启Docker后报错：Error response from daemon

2365

0

0

this xml file does not appear to have any style in

51956

10

0

sql server的用户名和密码怎么查啊？

37566

21

0

LoRa的网络覆盖能力范围是怎么样的？

3232

1

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60980

32

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3705

1

0

OSS的endpoint如何查看

37545

6

0

阿里云服务器如何重置系统？

24763

4

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

程序员都在偷偷用的AI编程神器！2025高效自动写代码工具全解析

实力强劲的机器视觉公司有哪些：2025年TOP5精选榜单

2025 年度机器视觉公司有哪些：从技术实力到落地案例的全方位选型参考

NeurlPS 2025！多伦多大学TIRE助力3D/4D 生成精准保留主体身份

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope有没有人知道windows安装ttsfrd的方法或者ttsfrd源码？

在ModelScope中，请问模型下载到本地的具体方法？

创业项目：AI 拟人化中层解决方案

服务器上onnxruntime-gpu 调用结束，如何释放显存

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

展开全部

还有其他疑问?