备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope如果训练数据较大（上TB级别的），应该怎么加载训练数据集，有示例代码吗？

ModelScope如果训练数据较大（上TB级别的），应该怎么加载训练数据集，有示例代码吗？kwargs = dict( model='damo/nlp_gpt3_text-generation_chinese-large', train_dataset=train_dataset, eval_datase=eval_dataset, max_epochs=max_epochs, work_dir=tmp_dir, cfg_modify_fn=cfg_modify_fn) train_dataset　和　eval_dataset　只能一次加载吗？如果数据集合比较大，内存没那么大

展开

收起

鸡蛋灌饼儿 2023-02-19 15:21:26 321 版权

1 条回答

写回答

取消提交回答

月亮很亮

如果本地磁盘没有足够空间的话，可以在加载数据集的时候使用streaming模式，即 ds = MsDataset.load(..., use_streaming=True) ；具体是modelscope上的哪个数据集呢？如果是这种方式的话，在访问ds对象的时候直接 for item in ds，然后得到的应该是单条数据内容(for 文本数据集)或者单个文件的本地缓存路径(for 其它类型数据集)；——该回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-02-19 20:03:27

赞同展开评论

相关问答

如何用python 加载ModelScope中的模型

455

1

0

ModelScope为啥使用notebook的cpu版本，finetune.sh脚本去训练一直失败？

143

1

0

modelscope这个古诗数据集我要不要把分隔符定义为'\n'?

68

1

0

我可否先在网上下载数据集，然后替换到modelscope文件里面?

222

1

0

从modelscope下载数据集后很乱？

178

1

0

在modelscope上下载qwen2的0.5版本，左边这个正常加载，右边这个报错，为什么？

242

1

0

modelscope训练完一直出现同一个错误怎么回事？

153

1

0

本地试调一定需要ModelScope模型文件吗？

52

1

0

得到的modelscope-funasr新模型还具有热词定制化能力吗？

87

1

0

modelscope-funasr这个模型的fineturn.sh输出只有三个log文件是吗？

60

0

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

OBS美颜美肌插件安装使用教程

AI Ping：精准可靠的大模型服务性能评测平台

Python图片上采样工具 - RealESRGANer

pytorch基于AnimeFace128数据集训练DCGAN

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

如何下载modelscope模型？

cpu部署报错 Torch not compiled with CUDA enabled

在ModelScope中，下载模型时的ssl问题怎么解决？!

服务器上onnxruntime-gpu 调用结束，如何释放显存

在ModelScope中，请问模型下载到本地的具体方法？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

JoyCaption：开源的图像转提示词生成工具，支持多种风格和场景，性能与 GPT4o 相当

展开全部

还有其他疑问?