GDC2025 | DeepSeek-Qwen 模型蒸馏极限挑战赛,来了!(预赛报名)

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 欢迎您关注由魔搭社区 x SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。

image.png image.png

亲爱的 AI 开发者们:

欢迎您关注由魔搭社区 x SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。

image.png

报名时间:2025年2月16日~20日12时

1.👨‍💻2025全球开发者先锋大会(GDC)

2025年GDC全球开发者先锋大会将于2月21日至23日在上海徐汇西岸举行。今年的GDC将以“模塑全球 无限可能”为主题,汇聚全球顶尖开发者、科技大咖和AI专家,共同探讨人工智能、元宇宙、机器人等前沿技术的未来发展方向。

image.png

GDC脱胎于世界人工智能大会(WAIC)旗下“开发者生态”子品牌,今年将是第三年举办。大会致力于为基础模型、垂类模型、要素资源、应用场景等各方伙伴拓宽沟通渠道,帮助软件开发者找到场景和项目、大咖和方向、模型和要素、基金和投资人,还能找到工作和人脉。

作为 GDC 大会期间的活动之一,加入本次挑战赛不仅可以体验到完整的模型蒸馏实践,还能在 GDC 大会场馆内与国内外 100 家开发者社区交流学习,包括 阿里魔搭社区、华为社区、微软开发者社区、CSDN、Linux 基金会 等国内国际头部社区,DeepSeek 团队也将积极参与到本次大会当中。

2.🤖DeepSeek-Qwen 模型蒸馏极限挑战赛规则

本次比赛将进行双阶段竞技,第一阶段预赛「轻量化先锋训练营」,将征集并筛选优秀的 10-12 支队伍在规定时间内蒸馏 Qwen2.5-3B 模型。预赛结束后,将选取 TOP4 支精锐队伍进入第二阶段的线下决赛「极限压缩挑战赛」,2 小时现场蒸馏 Qwen2.5-0.5B 模型。赛事小程序

参赛队伍将有机会获得

  • 云端 GPU 资源(最高3000小时英伟达A10算力)
  • 大模型资源 token API 调用资源(最高3亿 Qwen2.5-Max Token)
  • SwanLab 专业版权益
  • 魔搭社区模型入驻资格
  • 实物礼品及模型推广等支持

当前赛事阶段期望征集最优秀的 10-12 支队伍参加预赛,预赛详细信息见下文, 期待各位开发者积极组队报名加入!

3.预赛详细信息

image.png

image.png

image.png

image.png

4.扫码参会GDC2025

欢迎扫码报名参会GDC2025,现场观看决赛,与全球开发者交流。

image.png

目录
相关文章
|
22天前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
296 109
|
29天前
|
存储 人工智能 自然语言处理
告别文字乱码!全新文生图模型Qwen-Image来咯
通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。
337 2
|
1月前
|
文字识别 算法 语音技术
基于模型蒸馏的大模型文案生成最佳实践
本文介绍了基于模型蒸馏技术优化大语言模型在文案生成中的应用。针对大模型资源消耗高、部署困难的问题,采用EasyDistill算法框架与PAI产品,通过SFT和DPO算法将知识从大型教师模型迁移至轻量级学生模型,在保证生成质量的同时显著降低计算成本。内容涵盖教师模型部署、训练数据构建及学生模型蒸馏优化全过程,助力企业在资源受限场景下实现高效文案生成,提升用户体验与业务增长。
344 23
|
1月前
|
人工智能 JavaScript 测试技术
Cradle:颠覆AI Agent 操作本地软件,AI驱动的通用计算机控制框架,如何让基础模型像人一样操作你的电脑?
Cradle 是由 BAAI‑Agents 团队开源的通用计算机控制(GCC)多模态 AI Agent 框架,具备视觉输入、键鼠操作输出、自主学习与反思能力,可操作各类本地软件及游戏,实现任务自动化与复杂逻辑执行。
184 6
|
2月前
|
人工智能 弹性计算 API
再不玩通义 VACE 模型你就过时了!一个模型搞定所有视频任务
介绍通义的开源模型在 ecs 或 acs 场景如何一键部署和使用,如何解决不同视频生成场景的问题。
|
2月前
|
人工智能 弹性计算 JSON
再不玩通义VACE模型你就过时了!一个模型搞定所有视频任务
阿里巴巴开源通义万相Wan2.1-VACE,业界功能最全的视频生成与编辑模型,支持文生视频、图像参考生成、视频重绘、局部编辑、背景延展等,统一模型实现多任务自由组合,轻量版本消费级显卡即可运行。
|
5天前
|
机器学习/深度学习 算法 数据可视化
从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
推理型大语言模型兴起,通过先思考再作答提升性能。本文介绍GRPO等强化学习算法,详解其原理并动手用Qwen2.5-3B训练推理模型,展示训练前后效果对比,揭示思维链生成的实现路径。
80 1
从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
|
23天前
|
机器学习/深度学习 人工智能 JSON
微软rStar2-Agent:新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型
Microsoft Research最新推出的rStar2-Agent在AIME24数学基准测试中以80.6%的准确率超越超大规模模型DeepSeek-R1,展现“思考更聪明”而非“更长”的AI推理新方向。
96 8
微软rStar2-Agent:新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型

热门文章

最新文章