14B小模型代码成绩紧逼O3-Mini！DeepCoder-14B-Preview：基于Deepseek-R1蒸馏优化的开源代码生成模型

2025-04-10 695

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： DeepCoder-14B-Preview是基于Deepseek-R1蒸馏优化的140亿参数模型，通过强化学习微调在LiveCodeBench达到60.6%准确率，开源训练数据与系统优化方案。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

💻 「14B小模型暴打GPT-4！开源代码生成器竟自带单元测试」

大家好，我是蚝油菜花。当程序员们还在为Copilot的订阅费肉疼时，这个开源模型已经用1/3的参数量造出了代码生成界的"贫铀弹"！

你是否经历过这些编码至暗时刻：

👉 凌晨三点Debug，AI生成的代码永远差个分号
👉 单元测试写得比业务代码还长，覆盖率死活上不去
👉 想微调专属代码助手，结果被天价算力账单劝退...

今天要解剖的 DeepCoder-14B-Preview ，正在重写AI编程规则！这个由Agentica与Together AI联手打造的神器：

✅ 性能屠榜：60.6% LiveCodeBench准确率，拳打GPT-4脚踢Claude3
✅ 强化学习黑盒：用分布式RL训练，奖励机制严苛如奥林匹克裁判
✅ 工业级开源：数据/代码/日志全公开，24K编程题集堪比"码农高考题库"

已有团队用它1小时生成全栈项目脚手架，文末附《强化学习调参避坑指南》——你的IDE准备好迎接AI核爆了吗？

🚀 快速阅读

DeepCoder-14B-Preview是当前最强的开源代码生成模型之一。

性能：14B参数在LiveCodeBench达到60.6%准确率，媲美商用模型
技术：基于分布式强化学习微调，采用迭代上下文扩展技术

DeepCoder-14B-Preview 是什么

DeepCoder-14B-Preview 是 Agentica 和 Together AI 联合开源的大型代码生成模型，基于 Deepseek-R1-Distilled-Qwen-14B 微调而成。该模型在代码生成任务上表现出色，特别是在 LiveCodeBench 上达到 60.6% 的准确率，与主流商用模型性能相当。