文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中我自己的dataset.jsonl数据量少，一千条左右，该怎么做？

nproc_per_node=1
CUDA_VISIBLE_DEVICES=0,1,2,3 \
torchrun \
--nproc_per_node=$nproc_per_node \
--master_port 29500 \
llm_sft.py \
--model_type modelscope-agent-7b \
--sft_type lora \
--output_dir runs \
--dataset dataset.jsonl \
--dataset_sample -1 \
--num_train_epochs 3 \
--dataset_test_size 0.02 \
--max_length 2048 \
--dtype bf16 \
--lora_rank 8 \
--lora_alpha 32 \
--lora_dropout_p 0.01 \
--batch_size 1 \
--learning_rate 1e-4 \
--eval_steps 1 \
--save_steps 1 \
--save_total_limit 2 \
--logging_steps 20 \
--use_flash_attn true \
--ddp_backend nccl \
--gradient_accumulation_steps $(expr 16 / $nproc_per_node) \ModelScope中我自己的dataset.jsonl数据量少，一千条左右，我设的参数如上，推理好像没学到特征，能帮我看下吗？报错，--lora_target_modules ALL这个参数，要和其他参数一起调整吗？

展开

收起

小小鹿鹿鹿 2024-03-05 15:28:30 250 版权

1 条回答

写回答

取消提交回答

小小杳杳杳

pip show ms-swift看下。--lora_target_modules ALL加个这个试试。看下这个文档，
https://github.com/modelscope/swift/blob/main/docs/source/LLM/Agent%E5%BE%AE%E8%B0%83%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.md
。此回答来自钉群魔搭ModelScope开发者联盟群 ①。

2024-03-05 17:17:48

赞同 1 展开评论

相关问答

ModelScope中，instruct数据不好构造，是不是可以继续预训练？大概需要多少数据量？

298

1

0

num_train_epochs ModelScope数据量较大时候可能满足不了吧？

366

0

0

训练集和测试集数据均为13条数据，ner的，是不是ModelScope的数据量太少了？

159

1

0

ModelScope模型ner训练大概多少数据量会有效果呢？

138

1

0

modelscope-funasr微调时数据量大当一个batch处理不完的时候会有报错怎么解决？

316

2

0

请问modelscope-funasr 最多可以用多大的数据量进行训练呢？

286

2

0

ModelScope 用少量数据进行训练了，结果显示这样。这个跟数据量有关吗？

166

1

0

ModelScope有没有mgeo自动化标注工具啊，或是您给推荐一个，数据量有点大人工标注就得疯了？

242

1

0

ModelScope图片5000*5000有3w左右的数据量，怎么生成一段200-300字的描述？

218

1

0

老师们好，ModelScope如果测试阶段微调中文的clip ，时间和数据量有大概的预期嘛，比如微？

532

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

机房精细化运维：U 位资产管理如何解决数据中心资产管控痛点

盘点识别稳定性、系统扩展性｜RFID 固定资产管理系统核心技术指标推荐

不要盲目上 AI 固资系统！很多企业踩错了智能化转型第一步

智能集中器基于阿里云EMQX的工厂车间边端协同实战

RFID工器具数字化和智能化管控

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

泛时序数据一站式分析与洞察

多模态数据信息提取

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

在魔塔ModelScope上有以下报错，怎么解决？

ModelScope的readme文件点选编辑但仍然提示readme文件缺失license等信息？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

IndexTTS 部署报错：No module named 'tn'

代码里下载数据集 ModelScope报错应该如何解决？

ModelScope这个免费额度可以在哪里查询啊？

展开全部

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

LTX-2.3开源：视频生成引擎级升级

ModelScope是什么？魔搭社区AI模型开源社区，模型即服务（MaaS）的共享平台

阿里云通义千问向全社会开放！

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

ModelScope介绍：魔搭社区是什么？在魔搭社区能做哪些事？

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

See3D：智源研究院开源的无标注视频学习 3D 生成模型

Dropout的深入理解（基础介绍、模型描述、原理深入、代码实现以及变种）

展开全部

还有其他疑问?