备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope的lora训练之后怎么会这样呢？

ModelScope的lora训练之后怎么会这样呢？

展开

收起

陈幕白 2023-12-13 16:24:11 155 版权

1 条回答

写回答

取消提交回答

顾九思

回答1：就是普通的csv，比如字段： text,label 每一条的输出就是 {'text': xxx, 'label': xxx ，可以print(next(iter(train_dataset)))查看，一般label这些在preprocessor中指定。可以先查看一下模型卡片上提供的数据集格式，后面用自己的数据集微调。回答2:无回答回答3：无回答回答4：csv文件本身是逗号分隔文件，因此只要符合逗号分隔，值是什么都可以，加载出来的就是一个dataset 回答 5：参考链接：https://modelscope.cn/datasets/modelscope/Libri2Mix_8k/dataPeview ，这个是输入数据集的格式具体介绍在这里：https://modelscope.cn/datasets/modelscope/Libri2Mix_8k/summary 回答 6：您从.to_torch_dataset那里拆开查看比较方便，，原csv文件读取后应该是这样的：{'id': '1578-6379-0038_6415-111615-0009', 'mix_wav:FILE': '/root/.cache/modelscope/hub/datasets/modelscope/Libri2Mix_8k/master/data_files/extracted/e48c3496515ca52ec330f35de7450b5905206d3ecc58a52450b9a07005d8b335/train/mix_clean/1578-6379-0038_6415-111615-0009.wav', 's1_wav:FILE': '/root/.cache/modelscope/hub/datasets/modelscope/Libri2Mix_8k/master/data_files/extracted/e48c3496515ca52ec330f35de7450b5905206d3ecc58a52450b9a07005d8b335/train/s1/1578-6379-0038_6415-111615-0009.wav', 's2_wav:FILE': '/root/.cache/modelscope/hub/datasets/modelscope/Libri2Mix_8k/master/data_files/extracted/e48c3496515ca52ec330f35de7450b5905206d3ecc58a52450b9a07005d8b335/train/s2/1578-6379-0038_6415-111615-0009.wav', 'length': 53560.0}。数据集页面上也可以查看。如果想传到 modelscope 上，再加载，也可以参考这个最佳实践： https://modelscope.cn/docs/%E3%80%90%E7%A4%BA%E4%BE%8B%E3%80%91%E6%95%B0%E6%8D%AE%E9%9B%86%E6%89%98%E7%AE%A1%E5%88%B0ModelScope ，正好也是音频相关的。参考链接：https://modelscope.cn/docs/%E3%80%90%E7%A4%BA%E4%B...88%B0ModelScope 此回答整理自钉群 “魔搭ModelScope开发者联盟群 ①”

2023-12-13 16:58:39

赞同展开评论

相关问答

ModelScope为啥使用notebook的cpu版本，finetune.sh脚本去训练一直失败？

148

1

0

在modelscope-funasr中训练数据时长和训练时长有没有一个估算公式？

131

0

0

在modelscope-funasr中请问sensevoice微调时，训练数据怎么准备？

205

0

0

加了ModelScope参数是这样，跳过训练了，怎么解决？

100

1

0

modelscope-funasr微调训练的过程中，为什么log里面没有cer_ctc这个指标？

149

0

0

modelscope中， GitHub上给了mossformer的训练和评估代码，报错怎么解决？

121

0

0

请问ModelScope的megatron微调支持使用lora吗？

171

0

0

ModelScope训练之后不能merge-lora，也不能用vllm推理了吗？

163

1

0

使用lora微调qwen-vl模型之后，输出的ModelScope全是乱码，这是什么情况？

515

1

0

modelscope-funasr的paraformer模型从0训练可以用来做音频识别音素模型吗？

116

0

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

阿里云数据库MongoDB版收费价格：分片集群和副本集费用清单

从 50 步到 4 步：LightX2V 如何把视频生成拉进20 秒时代？

蓝牙信标人员定位系统：从技术原理、架构设计到实现方案详解（一）

万物联网

基于SpringBoot的番茄种植全流程管理系统

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

服务器上onnxruntime-gpu 调用结束，如何释放显存

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

在ModelScope中，下载模型时的ssl问题怎么解决？!

ModelScope通义千问是多大的模型参数，收费标准跟7B有差距吗？

ModelScope的PAI-DSW中，怎么上传一个文件夹？

展开全部

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

展开全部

还有其他疑问?