Fine-tune 的简介

本文涉及的产品
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: Fine-tune 的简介

微调简介

fine-tune就是在LLM常说的微调的英文。在LLM中要训练一个模型是一个费时、费力、费钱的工作,由于模型规模大、参数多在训练过程中会占用大量的时间和计算资源,尤其是一个复杂任务,想要提升模型的能力,就需要通过大量的数据进行训练这都是需要更多的投入的。那么如果有一个现成的模型,和我们要觉得的问题相似,那么我们就可以通过在这个模型的基础之上通过微调达到我们想要的能力。微调就是在一个预训练的大模型上,使用一些特定领域的数据再次进行训练,从而让预训练模型能够适应特定领域、特定任务。在微调过程中,模型的参数会依据新的数据进行调整,从而可以满足特定领域、特定任务的需求。

那么这个微调也有一些不同的方法,其中全面微调(full fine-tuning)就是在微调过程中全部的模型参数都会有所调整。这也就注定了全面微调对于计算资源的投入、数据规模的要求等都需要更多的支持。全面微调因为调整了全部的参数,很容易引起灾难性遗忘(catastrophic forgetting),灾难性遗忘就是再进行全面的微调以后得到的模型在原始任务上的能力表现非常糟糕,以至于达到了难以接受的下降。

那么参数高效微调(parameter-efficient fine-tuning,简称PEFT)是另外一种微调方法。PEFT在微调过程中只会调整一部分模型参数或者不会修改原来参数而是加上一些新参数,从而降低了对计算投入和数据规模的要求。PEFT 在参数效率、内存效率、训练速度、模型性能和推理成本上都有综合的平衡。PEFT 中分为选择法(selective)、基于重参数法(reparametrization-based)、附加法(additive)。选择法会选择一部分 LLM 的初始参数进行微调,因为再选择的时候,可以选择某些组件、某些参数也可以选择一个参数,因此保持参数效率、内存效率、训练速度、模型性能和推理成本之间的平衡。基于重参数法利用的是低秩矩阵表示来减少可训练参数数量,当前使用较多的是 LoRA(Low-Rank Adaptation),将权重更新做一个低秩矩阵分解,使用大模型适配下游任务时只需要训练少量的参数即可达到一个很好的效果,在 LoRA 中,先冻结预训练模型的权重,然后使用Kronecker乘积重参数化的方法,可以在秩和参数数量间找到更好的平衡。
image.png

附加法包含了Adapt 和soft pormpt,其中Adapt在模型中添加新的可训练层,大部分这个适配器实在 encode、decode 里或者实在attention、反馈层后。soft prompts 主要是通过 prompt tuning在每一次的交互中加一些预置的soft prompt 从而实现优秀的微调。
image.png

目录
相关文章
|
3月前
|
人工智能 安全 机器人
OpenClaw阿里云/本地1分钟部署图文教程,配置Kimi-k2.5+集成飞书机器人远程操控指南
2026年,开源AI工具生态迎来爆发式增长,而OpenClaw(前身为Clawdbot、曾用名Moltbot)凭借“中文原生适配+强执行能力+生态开放”的核心优势脱颖而出,成为国内AI玩家的首选智能执行引擎。其2026.2.2版本更是带来三大关键升级:飞书专属适配让中文交互更自然,更快的构建速度提升任务响应效率,全面安全加固筑牢使用防线,彻底打破传统AI“只说不做”的局限——不仅能完成文件管理、代码开发等本地任务,更能通过免费模型与远程操控功能,实现“随时随地发指令,AI全程自动办”。
4022 6
|
3月前
|
机器学习/深度学习 文字识别 数据挖掘
BookRAG:面向层级文档的树-图融合RAG框架
BookRAG是专为书籍类层级文档设计的新型RAG框架,首创“树+图+链接+Agent”四元结构:构建融合版面层级树与知识图谱的BookIndex,通过GT-Link双向映射实现结构与语义统一;引入信息觅食启发的Agent,动态规划检索路径,支持单跳、多跳及全局聚合查询,在精度、覆盖率与效率上显著优于传统文本/版面优先方法。
484 5
BookRAG:面向层级文档的树-图融合RAG框架
|
2月前
|
人工智能 供应链 API
阿里云Coding Plan是什么?总是售罄怎么办?附解决攻略
阿里云Coding Plan因高性价比与顶级模型支持成开发者焦点,但Pro版每日9:30限量补货、秒罄难求。本文解析其价值,提供抢购技巧,并推荐百炼平台替代方案:免抢购、赠100万Tokens、按量付费,灵活适配各类需求。
595 5
|
4月前
|
人工智能 安全 API
2026年阿里云OpenClaw(Clawdbot)部署与企业级自动化保姆级全栈教程
2026年,开源AI智能体赛道迎来爆发式增长,OpenClaw(原Clawdbot,曾用名Moltbot)凭借“自然语言交互+全场景任务自动化+插件化技能生态”的核心优势,GitHub星标数快速突破18万+,成为个人与企业搭建专属数字员工的首选方案。作为2026年阿里云开发者社区重点推荐的AI部署项目,OpenClaw与阿里云生态实现深度适配,通过专属轻量应用服务器镜像、百炼大模型原生对接、OSS存储无缝集成,彻底解决了传统部署“环境配置复杂、版本兼容困难、安全管控缺失”的三大痛点。
1838 0
|
5月前
|
物联网 测试技术
为什么 loss 几乎没用:微调里最容易让人“自嗨”的指标
本文揭示了大模型微调中一个常见误区:过度依赖loss曲线判断训练效果。loss仅反映模型对训练数据的拟合程度,并不衡量实际表现。它可能平稳下降,但模型输出无改善甚至变差。尤其在SFT/LoRA微调中,loss易被“虚假优化”,掩盖行为偏移、泛化缺失等问题。真正关键的是人工对照输出变化,结合loss作为辅助参考,而非决策核心。
|
5月前
|
数据采集 人工智能 自然语言处理
一文读懂LLM微调:新手必知的原理、误区与场景化应用方案
本文深入浅出讲解LLM微调原理与实操,涵盖新手必知的核心概念、常见误区及场景化应用方案。通过类比“学霸特训”,解析微调与提示词区别,推荐轻量级LoRA方法,提供从数据准备、环境搭建到模型训练、效果评估的完整步骤,并附实用工具与避坑指南,助力AI初学者快速掌握定制化模型技能,实现个人或企业级AI应用落地。
|
5月前
|
人工智能 数据可视化 物联网
大模型微调技术入门:从核心概念到实战落地全攻略
本课程系统讲解大模型微调核心技术,涵盖LoRA、QLoRA等高效方法,结合ComfyUI与主流工具实战,从数据准备到模型部署全流程落地,助力开发者低成本定制专属AI模型。
|
缓存 固态存储 Java
Elasticsearch 的扩展性和性能调优
【9月更文第2天】Elasticsearch 是一个分布式的搜索和分析引擎,适用于各种大规模数据处理场景。随着数据量的增长和查询复杂度的增加,Elasticsearch 的性能优化变得尤为重要。本文将详细介绍如何通过硬件配置、集群规模调整以及查询优化策略来提升 Elasticsearch 的性能。
765 6
|
计算机视觉 Perl
YOLOv11改进策略【卷积层】| CVPR-2024 PKI Module 获取多尺度纹理特征,适应尺度变化大的目标
YOLOv11改进策略【卷积层】| CVPR-2024 PKI Module 获取多尺度纹理特征,适应尺度变化大的目标
571 0
YOLOv11改进策略【卷积层】| CVPR-2024 PKI Module 获取多尺度纹理特征,适应尺度变化大的目标
|
自然语言处理 安全 测试技术
基于大模型的应用的测试的一些注意事项
大模型应用测试需注意三大冲突:时间敏感性冲突,即模型数据可能随时间变得过时;数据真实性冲突,指训练数据中可能存在虚假信息,影响模型准确性;数据一致性冲突,表现为模型对语义相同但句法不同的输入反应不一。测试时应针对这些问题设计用例,确保模型性能。
735 4