备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中我自己的dataset.jsonl数据量少，一千条左右，该怎么做？

nproc_per_node=1
CUDA_VISIBLE_DEVICES=0,1,2,3 \
torchrun \
--nproc_per_node=$nproc_per_node \
--master_port 29500 \
llm_sft.py \
--model_type modelscope-agent-7b \
--sft_type lora \
--output_dir runs \
--dataset dataset.jsonl \
--dataset_sample -1 \
--num_train_epochs 3 \
--dataset_test_size 0.02 \
--max_length 2048 \
--dtype bf16 \
--lora_rank 8 \
--lora_alpha 32 \
--lora_dropout_p 0.01 \
--batch_size 1 \
--learning_rate 1e-4 \
--eval_steps 1 \
--save_steps 1 \
--save_total_limit 2 \
--logging_steps 20 \
--use_flash_attn true \
--ddp_backend nccl \
--gradient_accumulation_steps $(expr 16 / $nproc_per_node) \ModelScope中我自己的dataset.jsonl数据量少，一千条左右，我设的参数如上，推理好像没学到特征，能帮我看下吗？报错，--lora_target_modules ALL这个参数，要和其他参数一起调整吗？

展开

收起

小小鹿鹿鹿 2024-03-05 15:28:30 136 版权

1 条回答

写回答

取消提交回答

小小杳杳杳

pip show ms-swift看下。--lora_target_modules ALL加个这个试试。看下这个文档，
https://github.com/modelscope/swift/blob/main/docs/source/LLM/Agent%E5%BE%AE%E8%B0%83%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md
。此回答来自钉群魔搭ModelScope开发者联盟群 ①。

2024-03-05 17:17:48

赞同 1 展开评论

相关问答

ModelScope中，instruct数据不好构造，是不是可以继续预训练？大概需要多少数据量？

168

1

0

num_train_epochs ModelScope数据量较大时候可能满足不了吧？

220

0

0

训练集和测试集数据均为13条数据，ner的，是不是ModelScope的数据量太少了？

87

1

0

ModelScope模型ner训练大概多少数据量会有效果呢？

66

1

0

modelscope-funasr微调时数据量大当一个batch处理不完的时候会有报错怎么解决？

179

2

0

请问modelscope-funasr 最多可以用多大的数据量进行训练呢？

191

2

0

ModelScope 用少量数据进行训练了，结果显示这样。这个跟数据量有关吗？

86

1

0

ModelScope有没有mgeo自动化标注工具啊，或是您给推荐一个，数据量有点大人工标注就得疯了？

137

1

0

ModelScope图片5000*5000有3w左右的数据量，怎么生成一段200-300字的描述？

111

1

0

老师们好，ModelScope如果测试阶段微调中文的clip ，时间和数据量有大概的预期嘛，比如微？

403

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

展厅机器人技术深度解析与主流商用产品选型指南

展厅机器人技术深度解析与主流产品选型指南

AR眼镜工业设备巡检运维的应用场景介绍｜阿法龙XR云平台

3.7V升压5V芯片深度剖析，PW5100/PW5300A/PW6276，选型无忧

室内人员定位手环从核心技术的差异、核心功能、应用场景及选购要点详解

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

com/action/joingroup?code=v1是什么意思

关于 Windows平台上 ttsfrd 库的问题。

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

共学 | 2025年，更加有效地搭建Agent

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

中文大模型体验

Meta SAM3开源：让图像分割，听懂你的话

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

通义百聆语音双子星，同步开源！

展开全部

还有其他疑问?