文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope中，Swift如何把Lora的微调方法改成long Lora呢？

ModelScope中，想请教大家，最近longlora,70k的长文本损失在5%左右，就是不知道Swift如何把Lora的微调方法改成long Lora呢

展开

收起

多麻辣哦 2023-10-18 20:43:26 453 版权

1 条回答

写回答

取消提交回答

sunrr
要将Swift的微调方法改为Long Lora，您需要执行以下步骤：
1. 准备Long Lora数据集：首先，您需要收集一个包含长文本的Long Lora数据集。确保数据集具有足够的样本量和多样性，以便模型能够学习到长文本的特征。
2. 修改模型结构：根据Long Lora任务的需求，您可能需要调整模型的结构。例如，您可以增加更多的Transformer层或改变注意力机制等。请根据您的需求进行相应的修改。
3. 修改训练策略：为了适应长文本任务，您可能需要调整训练策略。例如，您可以使用更长的训练轮次、更大的批次大小或调整学习率等。此外，您还可以尝试使用一些优化技巧，如梯度累积、混合精度训练等。
4. 微调模型：使用准备好的Long Lora数据集对模型进行微调。在微调过程中，您可以使用类似于Swift的方法，例如预训练-微调策略。首先，使用大量无标签的长文本数据对模型进行预训练；然后，使用有标签的长文本数据对模型进行微调。在微调过程中，您可以监控损失函数的变化，并根据需要调整训练策略。
5. 评估模型性能：在微调完成后，使用一些评估指标（如准确率、召回率等）来评估模型在Long Lora任务上的性能。如果性能不佳，您可以尝试进一步调整模型结构和训练策略。
2023-10-19 14:04:03

赞同展开评论

相关问答

请问如何使用ms-swift工具验证模型微调的效果？

572

0

0

有没有什么方法可以提升modelscope-funasr对人名、地名的识别率？

516

1

0

请问用modelscope里swift的dpo微调模型的断点Debug方式，有相关文档说明吗？

654

1

0

为什么我微调modelscope大模型时报错，让我升级内核啊？能升级吗？

281

1

0

modelscope CPU跑chatglm有什么加速的方法嘛？

299

1

0

ModelScope我试着用swift 微调后微调的模型都失去逻辑怎么办？

325

1

0

ModelScope今天更新了一下仓库就这样了重新安装ms-swift没有用怎么办？

401

1

0

ModelScope中Swift框架下加载 deepseek-coder-v2-lite怎么回事？

428

1

0

ModelScope今天更新了一下仓库就这样了重新安装ms-swift没有用该怎么办？

253

0

0

ModelScope中，使用SWIFT的进行sft报错，这是要升级驱动？

335

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

智慧医院系统开发定制方案如何满足不同医院需求？

云原生架构实战：百万级电子耳标与智慧牧场溯源中台重构分析

2026 生成式 AI 人才培养：从工具使用到标准化能力体系的行业演进

RFID + 资产管理系统：让“人找资产”变成“资产找人”

企业固定资产管理数字化转型：RFID技术选型与系统落地实践指南

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

ModelScope镜像地址是什么？

请问Modelscope互联网如何访问Notebook的服务呢？

【DCT-Net人像卡通化】生成图像颜色诡异暗青色

ModelScope中，本地部署魔搭镜像，怎么下载？有点看不懂

请问去哪里找ModelScope里面各个模型的id？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

LatentSync：根据音频生成高分辨率、动态逼真的唇形同步视频

ClotheDreamer：上海大学联合腾讯等高校推出的3D服装生成技术

JoyCaption：开源的图像转提示词生成工具，支持多种风格和场景，性能与 GPT4o 相当

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

展开全部

还有其他疑问?