文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope中，fine tune 怎么加载官方的数据集呢？

ModelScope中，fine tune 怎么加载官方的数据集呢？# Remember to use --fp16 instead of --bf16 due to autogptq
python finetune.py \
--model_name_or_path $MODEL \
--dataset modelscope/DuReader_robust-QG \

展开

收起

多麻辣哦 2023-11-08 20:32:27 351 版权

3 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

加载官方数据集可以通过将数据集位置传入命令行参数实现。在上述例子中，“$MODEL” 是要使用的模型路径，“modelscope/DuReader_robust-QG” 是要加载的数据集路径。
这意味着在调用 fine-tuning 脚本时，您应替换其中 “modelscope/DuReader_robust-QG” 部分为所需官方数据集的位置。
请确保您已经拥有适当的权限访问此数据集，并且您所提供的路径是正确的。

2023-11-09 14:22:07

赞同展开评论
sunrr
在ModelScope中，要加载官方的数据集，可以使用以下命令：
```
python finetune.py \
--model_name_or_path $MODEL \
--dataset modelscope/DuReader_robust-QG \
--do_train \
--do_eval \
--max_seq_length 512 \
--per_device_train_batch_size 8 \
--learning_rate 3e-5 \
--num_train_epochs 3 \
--output_dir output \
--overwrite_output_dir \
--fp16
```
这里使用了--do_train和--do_eval参数来指定进行训练和评估。--max_seq_length参数用于设置输入序列的最大长度，--per_device_train_batch_size参数用于设置每个设备的训练批次大小，--learning_rate参数用于设置学习率，--num_train_epochs参数用于设置训练轮数，--output_dir参数用于设置输出目录，--overwrite_output_dir参数用于覆盖已有的输出目录，--fp16参数用于使用半精度浮点数进行训练。
2023-11-09 11:08:09

赞同展开评论
超爱吃辣

https://github.com/modelscope/swift/tree/main/examples/pytorch/llm
可以看文档哈——此回答整理自钉群：魔搭ModelScope开发者联盟群 ①

2023-11-08 21:40:04

赞同展开评论

相关问答

modelscope这个古诗数据集我要不要把分隔符定义为'\n'?

146

1

0

我可否先在网上下载数据集，然后替换到modelscope文件里面?

350

1

0

从modelscope下载数据集后很乱？

428

1

0

在modelscope上下载qwen2的0.5版本，左边这个正常加载，右边这个报错，为什么？

379

1

0

ModelScope中Swift框架下加载 deepseek-coder-v2-lite怎么回事？

402

1

0

在modelscope-funasr中funasr有在自有数据集上重新训练新模型的教程吗？

359

1

0

通过这个ModelScope去添加一个数据集去训练一下不知道是否推荐？

221

1

0

modelscope上已休眠的模型无法唤醒，要怎么办？

428

1

0

llamaindex整合modelscope本地模型，启动报错

712

1

0

modelscope-funasr这个模型的训练语音数据以及命令词列表有开源吗？

258

0

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

隐喻遮蔽与认知偏差：网络安全隐喻术语公众传播失效机理及优化路径研究

总量下行背景下政务定向钓鱼攻击演化与轻量化检测防御研究

WhatsApp 商务文档伪装钓鱼攻击技术机理与全域防御体系研究

2026 年 Q1 社交媒体仿冒钓鱼隐身攻击机理与全域防御体系研究

医疗行业模拟钓鱼演练伦理冲突与标准化管控体系研究

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

在ModelScope中，这个下载文件是模型文件吗？存储路径能改吗？

com/action/joingroup?code=v1是什么意思

ModelScope下载速度慢怎么解决？

ModelScope镜像地址是什么？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

问了豆包，一开始说是因为app.py没有添加，但添加之后还是发布失败，求解答

请问去哪里找ModelScope里面各个模型的id？

ModelScope这个免费额度可以在哪里查询啊？

如何下载modelscope模型？

展开全部

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

极致的显存管理！6G显存运行混元Video模型

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LTX Video：Lightricks推出的开源AI视频生成模型

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

展开全部

还有其他疑问?