文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope中，Swift如何把Lora的微调方法改成long Lora呢？

ModelScope中，想请教大家，最近longlora,70k的长文本损失在5%左右，就是不知道Swift如何把Lora的微调方法改成long Lora呢

展开

收起

多麻辣哦 2023-10-18 20:43:26 424 版权

1 条回答

写回答

取消提交回答

sunrr
要将Swift的微调方法改为Long Lora，您需要执行以下步骤：
1. 准备Long Lora数据集：首先，您需要收集一个包含长文本的Long Lora数据集。确保数据集具有足够的样本量和多样性，以便模型能够学习到长文本的特征。
2. 修改模型结构：根据Long Lora任务的需求，您可能需要调整模型的结构。例如，您可以增加更多的Transformer层或改变注意力机制等。请根据您的需求进行相应的修改。
3. 修改训练策略：为了适应长文本任务，您可能需要调整训练策略。例如，您可以使用更长的训练轮次、更大的批次大小或调整学习率等。此外，您还可以尝试使用一些优化技巧，如梯度累积、混合精度训练等。
4. 微调模型：使用准备好的Long Lora数据集对模型进行微调。在微调过程中，您可以使用类似于Swift的方法，例如预训练-微调策略。首先，使用大量无标签的长文本数据对模型进行预训练；然后，使用有标签的长文本数据对模型进行微调。在微调过程中，您可以监控损失函数的变化，并根据需要调整训练策略。
5. 评估模型性能：在微调完成后，使用一些评估指标（如准确率、召回率等）来评估模型在Long Lora任务上的性能。如果性能不佳，您可以尝试进一步调整模型结构和训练策略。
2023-10-19 14:04:03

赞同展开评论

相关问答

有没有什么方法可以提升modelscope-funasr对人名、地名的识别率？

489

1

0

modelscope CPU跑chatglm有什么加速的方法嘛？

265

1

0

modelscope微调后的多模态大模型Qwen-VL和graghrag相结合构建知识库的案例有嘛？

297

0

0

ModelScope我试着用swift 微调后微调的模型都失去逻辑怎么办？

299

1

0

ModelScope中，使用SWIFT的进行sft报错，这是要升级驱动？

299

1

0

请问ModelScope的swift部署本地模型有文章推荐吗？

208

0

0

ModelScope有啥方法提高一下呢？

172

0

0

ModelScope微调之后没有效果是数据集太少了吗？

283

1

0

modelscope的swift昨天部署还是正常运行的，今天重启电脑后就一直报错如下错误，怎么解决？

155

1

0

用swift推理训练后的ModelScope模型，参数里model stype是不是就不需要？

238

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

RFID车辆无感识别通行效率秒过

可商用的云MES系统源码，pringBoot + Vue3 + Uniapp，覆盖生产全流程，拿来即改

变电设备故障远程专家指导：重构电力运维的价值体系

当AI成为网络钓鱼的新引擎，我们如何守住数字防线？

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

modelscope cache 环境变量是啥？

ModelScope这个免费额度可以在哪里查询啊？

请问去哪里找ModelScope里面各个模型的id？

在ModelScope中，下载模型时的ssl问题怎么解决？!

ModelScope模型是咋收费的, 是按机器每小时收费嘛？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

Cobalt：开源的流媒体下载工具，支持解析和下载全平台的视频、音频和图片，支持多种视频质量和格式，自动提取视频字幕

DeepMesh：3D建模革命！清华团队让AI自动优化拓扑，1秒生成工业级网格

展开全部

还有其他疑问?