GDC2025 | DeepSeek-Qwen 模型蒸馏极限挑战赛,来了!(预赛报名)

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 欢迎您关注由魔搭社区 x SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。

image.png image.png

亲爱的 AI 开发者们:

欢迎您关注由魔搭社区 x SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。

image.png

报名时间:2025年2月16日~20日12时

1.👨‍💻2025全球开发者先锋大会(GDC)

2025年GDC全球开发者先锋大会将于2月21日至23日在上海徐汇西岸举行。今年的GDC将以“模塑全球 无限可能”为主题,汇聚全球顶尖开发者、科技大咖和AI专家,共同探讨人工智能、元宇宙、机器人等前沿技术的未来发展方向。

image.png

GDC脱胎于世界人工智能大会(WAIC)旗下“开发者生态”子品牌,今年将是第三年举办。大会致力于为基础模型、垂类模型、要素资源、应用场景等各方伙伴拓宽沟通渠道,帮助软件开发者找到场景和项目、大咖和方向、模型和要素、基金和投资人,还能找到工作和人脉。

作为 GDC 大会期间的活动之一,加入本次挑战赛不仅可以体验到完整的模型蒸馏实践,还能在 GDC 大会场馆内与国内外 100 家开发者社区交流学习,包括 阿里魔搭社区、华为社区、微软开发者社区、CSDN、Linux 基金会 等国内国际头部社区,DeepSeek 团队也将积极参与到本次大会当中。

2.🤖DeepSeek-Qwen 模型蒸馏极限挑战赛规则

本次比赛将进行双阶段竞技,第一阶段预赛「轻量化先锋训练营」,将征集并筛选优秀的 10-12 支队伍在规定时间内蒸馏 Qwen2.5-3B 模型。预赛结束后,将选取 TOP4 支精锐队伍进入第二阶段的线下决赛「极限压缩挑战赛」,2 小时现场蒸馏 Qwen2.5-0.5B 模型。赛事小程序

参赛队伍将有机会获得

  • 云端 GPU 资源(最高3000小时英伟达A10算力)
  • 大模型资源 token API 调用资源(最高3亿 Qwen2.5-Max Token)
  • SwanLab 专业版权益
  • 魔搭社区模型入驻资格
  • 实物礼品及模型推广等支持

当前赛事阶段期望征集最优秀的 10-12 支队伍参加预赛,预赛详细信息见下文, 期待各位开发者积极组队报名加入!

3.预赛详细信息

image.png

image.png

image.png

image.png

4.扫码参会GDC2025

欢迎扫码报名参会GDC2025,现场观看决赛,与全球开发者交流。

image.png

目录
相关文章
|
23天前
|
人工智能 编解码 文字识别
视觉理解模型Qwen2.5-VL开源,斩获多榜单冠军!
视觉理解模型Qwen2.5-VL开源,斩获多榜单冠军!
99 0
|
18天前
|
人工智能 JavaScript Python
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
|
20天前
|
测试技术 API 开发者
通义千问Qwen2.5-Max登上大模型盲测榜单全球前十,数学及编程能力夺冠
通义千问Qwen2.5-Max登上大模型盲测榜单全球前十,数学及编程能力夺冠
|
3月前
|
机器学习/深度学习 数据采集 人工智能
基于Qwen 2.5的世界科学智能大赛冠军方案
本方案基于通义千问模型,采用多阶段的Easy-to-Hard数据合成方法,模拟人类学习的由简单到困难的思路,逐阶段构造多样化的训练数据。数据生成阶段,训练数据的标签,引入了“Chain-of-Thought”思维链模式,生成多样化的推理路径,逐步对齐推理Scaling Law。训练阶段,采用了LoRA对通义千问32B模型在合成数据集上进行参数高效微调。推理阶段,使用了4bit低精度量化,并结合vLLM框架进行推理加速,最终达到准确性、效率和显存利用率的统一。
228 2
基于Qwen 2.5的世界科学智能大赛冠军方案
|
4月前
|
人工智能 自然语言处理 搜索推荐
浪潮信息 Yuan-embedding-1.0 模型登顶MTEB榜单第一名
浪潮信息Yuan-Embedding-1.0模型在C-MTEB评测基准中荣获Retrieval任务第一名,推动中文语义向量技术发展
浪潮信息 Yuan-embedding-1.0 模型登顶MTEB榜单第一名
|
机器学习/深度学习 人工智能 自然语言处理
讯飞星火大模型:AI语言模型的巅峰之作
今年,我们不得不提的一个热门话题就是ChatGPT,这是一款基于语言模型的人机对话系统。它在工作和生活中给我们带来了极大的便利。作为一名从事IT行业的人,我深切体会到了它在技术和文本处理方面的重要性。
450 0
讯飞星火大模型:AI语言模型的巅峰之作
|
4月前
|
物联网
聚众炼丹啦!魔搭LoRA挑战赛月度赛来啦!
哐~啷~咣~当~🔈 魔搭社区LoRA创意挑战赛月度赛来啦!
|
7月前
|
人工智能 测试技术 计算机视觉
7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单
【8月更文挑战第1天】新模型LongVA实现7B级最强长视频理解!通过长上下文转移技术,LongVA能够处理超千帧视频,显著提升长视频理解精度。不同于传统模型依赖视觉重采样导致的信息损失,LongVA扩展语言主干上下文长度,无需额外视频训练即可理解大量视觉标记。在V-NIAH等基准上取得SOTA成绩,处理2000帧以上视频无额外复杂度增加。但实时应用及非视频任务仍面临挑战。[论文](https://arxiv.org/abs/2406.16852)
170 4
|
9月前
|
人工智能 自然语言处理 算法
2024年6月上半月30篇大语言模型的论文推荐
大语言模型(LLMs)在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文,可以让你及时了解最新进展。
316 3
2024年6月上半月30篇大语言模型的论文推荐
|
7月前
|
数据采集 SQL 人工智能
如何基于gpt模型抢先打造成功的产品
如何基于gpt模型抢先打造成功的产品
79 0

热门文章

最新文章