备案控制台

开发者社区 > ModelScope模型即服务 > 正文

ModelScope中,为什么日志这里显示只有mix_dataset_sample: 76 ？

"请问现在使用自定义数据集的两个数据集，同时融合部分 ms-bench-mini --train_dataset_mix_ratio 0.05 \ --train_dataset_mix_ds ms-bench-mini \ --custom_train_dataset_path self.jsonl ruozhiba_qa_train.jsonl \日志打印如下：
ModelScope中,为什么日志这里显示只有mix_dataset_sample: 76 ？"

展开

收起

Lucidly 2024-05-01 10:36:40 9 0

1 条回答

写回答

取消提交回答

为了利利
"import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0' 参考以下代码
nproc_per_node=2
CUDA_VISIBLE_DEVICES=0,1 \
NPROC_PER_NODE=$nproc_per_node \
MASTER_PORT=29500 \
nohup swift sft \
--model_id_or_path /data/models/Baichuan2-13B-Chat \
--model_type baichuan-13b-chat \
--model_revision master \
--template_type baichuan \
--sft_type lora \
--tuner_backend peft \
--dtype AUTO \
--ddp_backend nccl \
--train_dataset_mix_ratio 0.9 \
--train_dataset_mix_ds ms-bench-mini \
--custom_train_dataset_path /data/dataset/sft/self.jsonl /data/dataset/sft/ruozhiba_qa_train.jsonl \
--num_train_epochs 5 \
--max_length 1024 \
--check_dataset_strategy warning \
--lora_rank 8 \
--lora_alpha 32 \
--lora_dropout_p 0.05 \
--lora_target_modules ALL \
--lora_dtype AUTO \
--gradient_checkpointing true \
--batch_size 1 \
--weight_decay 0.1 \
--learning_rate 1e-4 \
--gradient_accumulation_steps $(expr 16 / $nproc_per_node) \
--max_grad_norm 0.5 \
--warmup_ratio 0.03 \
--eval_steps 100 \
--save_steps 100 \
--save_total_limit 2 \
--logging_steps 5 \
--use_flash_attn false \
--deepspeed default-zero3 \
--save_only_model true \
--self_cognition_sample 200 \
--model_name PPT助手 'PPTASS' \
--model_author 陶喆 taozhe \
--add_output_dir_suffix False \
--output_dir /data/train-models/sft/lora/baichuan2-13b-chat/ \
--logging_dir /data/train-models/sft/lora/baichuan2-13b-chat/runs \
```
> /data/train-models/sft/lora/baichuan2-13b-chat/runs/run.log 2>&1 &        此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”   "
```
2024-05-01 16:01:46

赞同 1 展开评论打赏

相关问答

modelscope-funasr能结合说话人日志模型吗？

14

1

0

modelscope-funasr类似这些日志，应该怎么设置才能不打印呀？

25

0

0

modelscope-funasr服务端日志中显示部分热词OVV!是什么情况？

7

0

0

ModelScope中,类似以下日志，应该怎么设置才能不打印？

26

1

0

ModelScope微调的时候有以下日志,要怎么解决?

37

0

0

modelscope-funasr中，这段日志是怎么回事，为什么又要删掉，又要用到？

20

0

0

我flink-cdc接mysql/mongo 然后写入mq为什么经常日志会这样？

39

1

0

Flink CDC中oracle 归档日志一直在增加，启动flink以后，什么原因？

170

2

0

flink cdc的job可以开启gc日志吗？是否是在启动job命令追加jvm参数？

21

0

0

Flink刚失败的任务，jobmanager 日志咋丢了？

52

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

如何训练属于自己的“通义千问”呢？

ModelScope的Qwen1.5-14B-Chat需要多少大显存？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

我希望通过damo-YOLO训练1500*1500的图片

服务器上onnxruntime-gpu 调用结束，如何释放显存

请问ModelScope中，怎么修改本地运行，模型自动下载到 c 盘下？

Modelscope魔塔的创空间的文件怎么下载到本地呀？

ModelScope 使用14B模型推理时报这个错误？

展开全部

阿里云通义千问向全社会开放！

Llama 3开源！魔搭社区手把手带你推理，部署，微调和评估

阿里云助力开发者创新：探索云原生技术的新境界

ModelScope--人像卡通化、人像美肤

千亿大模型来了！通义千问110B模型开源，魔搭社区推理、微调最佳实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

Qwen1.5开源！魔搭最佳实践来啦！

ChatGPT中文版杀疯了,已登录AI模型市场

LLM大模型实战 —— DB-GPT阿里云部署指南

Llama3 中文通用Agent微调模型来啦！（附手把手微调实战教程）

展开全部

相关课程

更多

个性化语音合成模型微调

40

1

去学习

日志服务SLS实现云产品可观测

14

13

去学习

日志服务 SLS 可观测数据分析平台介绍

135

1

去学习

ModelScope社区Library技术架构介绍

174

1

去学习

大数据知识图谱系列—基于ELK+Flink日志全观测最佳实践

174

1

去学习

场景实践-基于阿里云Quick BI 对MOOC网站日志分析

47

7

去学习

相关电子书

更多

PostgresChina2018_赖思超_PostgreSQL10_hash索引的WAL日志修改版final 立即下载

Kubernetes下日志实时采集、存储与计算实践 立即下载

日志数据采集与分析对接 立即下载

相关实验场景

更多