❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦
🎯 「32B参数模型性能直逼671B的DeepSeek-R1!开源推理模型把数学题碾成渣」
大家好,我是蚝油菜花。当开发者还在为多模态模型的理解力抓狂时,这个来自昆仑万维的开源核弹正在重写推理模型的游戏规则!
你是否经历过这些AI智障时刻:
- ∑ 让AI解微分方程,结果把积分符号当表情包输出
- 💻 代码生成器把Python写成火星语,调试比手写还费劲
- 📊 想用模型做数据分析,却发现它连基础统计概念都混乱...
今天要解密的 Skywork-OR1 ,用三大技术革新终结这些尴尬:
- ✅ 数学脑外科手术:专项模型AIME数学题正确率碾压同尺寸选手
- ✅ 代码炼金术:32B参数模型性能直逼671B规模竞品
- ✅ 推理加速器:多阶段训练策略让模型像人类般逐步思考
已有科研团队用它破解流体力学方程,程序员靠它生成千行级项目代码——你的AI工具箱,是时候装上「推理外挂」了!
🚀 快速阅读
- Skywork-OR1是昆仑万维推出的开源高性能推理模型系列,包含7B/32B参数版本
- 核心功能:数学推理精度达69.8%、代码生成效率提升40%、支持多轮逻辑推演
- 技术原理:GRPO强化学习框架、11万题数学数据集、动态熵控制采样策略
Skywork-OR1 是什么
Skywork-OR1系列基于GRPO强化学习框架构建,通过多阶段训练策略逐步扩展模型的上下文处理能力。该系列包含三个版本:7B参数数学专项模型、7B通用预览版和32B旗舰版,分别针对不同复杂度的推理任务优化。
其训练数据经过严格筛选,数学数据集涵盖11万道高难度题目,代码数据集保留1.37万条通过单元测试的问题。在训练过程中采用动态采样验证机制,确保每个训练样本的有效性和挑战性。
Skywork-OR1 的主要功能
- 高阶数学推理:专项模型在AIME24/25数据集分别取得69.8%和52.3%准确率
- 全栈代码生成:支持多语言代码框架搭建与优化,LiveCodeBench性能提升43.6%
- 长链逻辑推演:通过多阶段窗口扩展训练,实现复杂问题的分步解决
- 自适应熵控制:在强化学习中采用τ=1.0高温采样,增强模型探索能力
Skywork-OR1 的技术原理
- 数据蒸馏技术:从89.6万题数学库中筛选AIME/Olympiads等高难度子集
- 混合验证机制:结合人工评审与LLM自动判题,清理低质量训练样本
- 策略损失优化:移除KL散度约束,在批次内平均所有token的损失值
- 窗口渐进训练:分阶段扩展上下文长度,提升长文本推理稳定性
如何运行 Skywork-OR1
1. 环境准备
Docker部署
docker pull whatcanyousee/verl:vemlp-th2.4.0-cu124-vllm0.6.3-ray2.10-te2.0-megatron0.11.0-v0.0.6
docker run --runtime=nvidia -it --rm --shm-size="10g" --cap-add=SYS_ADMIN -v <image:tag>
git clone https://github.com/SkyworkAI/Skywork-OR1.git && cd Skywork-OR1 && pip3 install -e .
Conda部署
conda create -n verl python==3.10
conda activate verl
pip3 install torch==2.4.0 --index-url https://download.pytorch.org/whl/cu124
pip3 install flash-attn --no-build-isolation
git clone https://github.com/SkyworkAI/Skywork-OR1.git
cd Skywork-OR1 && pip3 install -e .
2. 模型评估
数据准备
huggingface-cli download Skywork/LiveCodeBench --repo-type=dataset --local-dir ./or1_data/eval/livecodebench
unzip ./or1_data/eval/livecodebench/livecodebench.zip -d ./or1_data/eval/livecodebench/
执行测试
bash ./or1_scripts/eval/eval_7b.sh
bash ./or1_scripts/eval/eval_32b.sh
资源
- GitHub 仓库:https://github.com/SkyworkAI/Skywork-OR1
- HuggingFace 模型库:https://huggingface.co/collections/Skywork/skywork-or1-67fa1bcb41b436ef2def76b9
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦