MFTCoder 重磅升级v0.5.0发布,支持SST加训与DPO

简介: CodeFuse于2023年9月开源了多任务微调框架MFTCoder,支持多个任务并行微调,解决数据量不平衡等问题。具备高效训练、PEFT微调等特性,支持多种主流LLMs。最新v0.5.0版本新增DPO、SST加训等功能,代码已开源至GitHub,欢迎试用和贡献。

CodeFuse 在 2023 年 9 月开源了一种多任务微调框架——MFTCoder,它可以实现在多个任务上同时并行地进行微调。通过结合多种损失函数,我们有效地解决了多任务学习中常见的任务间数据量不平衡、难易不一和收敛速度不一致等挑战。大量实验结果显示,相较于单独对单个任务进行微调或者多任务混合为一后进行微调,我们的多任务微调方法表现更优。

此外,MFTCoder 具备高效训练特征,包括提供高效的数据 Tokenization 模式,支持 PEFT 微调和全量微调,能有效提升微调训练速度并降低对资源的需求。MFTCoder 是轻量的、简单清晰的、易于二次开发的、持续跟进 Cutting-Edge 技术的开源微调框架。

目前 MFTCoder 迭代到了 v0.5.0 版本, 新增了对 SST continue train、offline tokenization、DPO 等支持,可以进行预训练加训与强化对齐。

新升级代码也已经开源到了GitHub:https://github.com/codefuse-ai/MFTCoder/tree/main/mftcoder_accelerate

MFTCoder v0.5.0 新增功能

  • 新增 xxpo 模块支持 DPO/RPO/ORPO 等偏好对齐方法,可用于强化对齐。
  • 新增 mpt 模块支持全量参数 SST 加训。
  • 新增离线 tokenizer 模块支持预训练数据tokenization。
  • 更新 self-paced 均衡 loss 到新的收敛均衡 loss CoBa。
  • 新版本已经适配到 transformers v4.44.2,因此也支持了众多新的开源模型。

当前, MFTCoder 已适配支持更多的主流开源 LLMs,如Qwen2, Qwen2-moe, Gemma, Starcoder2, Mixtral、Mistral、Deepseek、 Llama、CodeLlama、Qwen、CodeGeeX2、StarCoder、Baichuan2、ChatGLM2/3、GPT-Neox 等。

更多 MFTCoder 相关内容详见:

MFTCoder 详细介绍见公众号文章:

干货!MFTCoder 论文多任务微调技术详解

MFTCoder 技术细节论文已被顶会 KDD 2024 (ADS) 接收:https://arxiv.org/pdf/2311.02303.pdf

MFTCoder 多任务收敛均衡方法 CoBa 已被顶会EMNLP 2024收录:https://arxiv.org/pdf/2410.06741

联系我们

MFTCoder 最新版本 v0.5.0 已经开源,感兴趣的同学可以用版本 tag 或者持续跟踪 main 分支,本文中提到的模型和数据集也在陆续开源中,如果您喜欢我们的工作,欢迎试用、指正错误和贡献代码,。任何贡献我们都会非常欢迎,详见Contribution Guide(https://codefuse.ai/contribution/contribution

如果你喜欢我们的项目,欢迎在 GitHub 上为我们点亮!

image.png

如果您想更快地获取到最新信息

欢迎加入我们的微信群

CodeFuse开源用户群活码.png

企业用户如有需求,加入群聊时还可私聊“CodeFuse服务助手”联系解决方案专家~

目录
相关文章
西门子S7-1200有什么功能特点?应用范围有哪些?CPU型号及模块类型有哪些?
S7-1200是西门子公司新推出的一款面向离散自动化系统和独立自动化系统的低端PLC。S7-1200采用了模块化设计,具备强大的工艺功能,适用于多种场合,可以满足不同的自动化需求。
西门子S7-1200有什么功能特点?应用范围有哪些?CPU型号及模块类型有哪些?
vue2实现markdown编辑器,实现同步滚动,实时预览等功能
vue2实现markdown编辑器,实现同步滚动,实时预览等功能
|
8月前
|
机器学习/深度学习 人工智能 搜索推荐
Deep Search 如何理解业务仓库代码?
本文系统地介绍了 Deep Search 和 Deep Research 的概念、与传统 RAG 的区别、当前主流的商业产品与开源方案、在代码领域的应用(如 Deep Search for 仓库问答)以及未来的发展规划。
706 21
Deep Search 如何理解业务仓库代码?
|
10月前
|
机器学习/深度学习 人工智能 文件存储
Llama Nemotron:英伟达开源基于Llama架构优化的推理模型,253B参数持平DeepSeek R1!
NVIDIA推出的Llama Nemotron系列推理模型,基于Llama架构优化,包含Nano/Super/Ultra三款,在数学推理、编程和工具调用等任务中展现卓越性能。
393 5
Llama Nemotron:英伟达开源基于Llama架构优化的推理模型,253B参数持平DeepSeek R1!
|
4月前
|
人工智能 监控 安全
91_提示注入:安全提示工程
随着大型语言模型(LLM)技术的快速发展和广泛应用,AI系统正以前所未有的方式改变着我们的工作和生活。然而,这种强大的技术也带来了新的安全挑战,其中提示注入(Prompt Injection)攻击已成为最具威胁性的安全问题之一。提示注入攻击通过精心构造的输入,操纵或欺骗AI系统执行非预期行为,可能导致数据泄露、权限绕过、输出不当内容等严重后果
|
人工智能 自然语言处理 IDE
CodeFuse IDE 0.6 版本发布,支持编辑器诊断问题 AI 修复
CodeFuse IDE 是基于蚂蚁自研大模型和 OpenSumi 框架的 AI 编程助手,支持多语言,提供代码建议、解释、测试生成等,增强开发效率。最新版增加 AI 修复和智能补全功能,开源并支持 VS Code 插件生态。[了解更多](https://github.com/codefuse-ai/codefuse-ide)
785 0
|
人工智能 Oracle Java
蚂蚁 CodeFuse 代码大模型技术解析:基于全仓库上下文的代码补全
CodeFuse 代码补全插件是 CodeFuse 系列产品中用户数量最多、留存率最大,调用AI能力最多的产品~欢迎大家体验试用https://github.com/codefuse-ai/RepoFuse
2520 7
蚂蚁 CodeFuse 代码大模型技术解析:基于全仓库上下文的代码补全
|
JSON 前端开发 JavaScript
成功解决:[object Object]
这篇文章讨论了在JavaScript中打印对象时出现的"[object Object]"问题的原因,并提供了使用`JSON.stringify()`方法将对象转换为字符串以便于打印和调试的解决方案。
成功解决:[object Object]
|
数据采集 安全 数据处理
制造业、工程设计行业、创投行业的数据治理痛点与解决方案
关注监管政策动态:密切关注数据治理相关法律法规的发布和更新,及时调整企业数据治理策略,确保合规经营。
制造业、工程设计行业、创投行业的数据治理痛点与解决方案
|
存储 算法 调度
深入理解操作系统:进程调度的算法与实现
【8月更文挑战第31天】在操作系统的核心,进程调度扮演着关键角色,它决定了哪个进程将获得CPU的使用权。本文不仅剖析了进程调度的重要性和基本概念,还通过实际代码示例,展示了如何实现一个简单的调度算法。我们将从理论到实践,一步步构建起对进程调度的理解,让读者能够把握操作系统中这一复杂而精妙的部分。

热门文章

最新文章