首届“通义千问AI挑战赛”

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
简介: Qwen AI 挑战赛由阿里云和 NVIDIA 主办,天池平台和魔搭社区联合承办,目标是通过高质量的数据探索和拓展开源模型 Qwen\- 1.8B 及 Qwen\- 72B 的代码能力上限。

正式开赛!阿里云携手 NVIDIA 举办首届 “通义千问 AI 挑战赛”

摘要:Qwen AI 挑战赛由阿里云和 NVIDIA 主办,天池平台和魔搭社区联合承办,目标是通过高质量的数据探索和拓展开源模型 Qwen- 1.8B 及 Qwen- 72B 的代码能力上限。

image

12 月1日,阿里云开源以业界领先前所未有的动作再次引领了人工智能领域的新浪潮,在发布会上公布了 通义千问“720 亿参数模型的 AI 巨模型 Qwen-72B” 、以及 “18 亿参数模型 Qwen-1.8B 、和音频大模型 Qwen-Audio,” 正式开源,并启动了揭幕了由阿里云和 NVIDIA 联合主办的重大赛事——“通义千问 AI 挑战赛”。宣布开源其 720 亿参数的 AI 巨模型 Qwen-72B,这一举措标志着阿里云在推动技术共享和生态协作上又迈出了重要一步。

Qwen 1.8B 及 Qwen 72B 开源模型特点

  • Qwen-72B 模型:不仅在 10 个权威基准测评中取得了突出成绩,更为大中型企业和科研机构打开了新的可能性,行业客户和开发者可以基于 Qwen-72B 开发各类应用或者进行 AI for Science 等前沿科研。
  • 在本次发布会上同步开源的还有 18 亿参数模型 Qwen-1.8B 和音频大模型 Qwen-Audio:,前者因其轻量级优势,能在普通消费级终端上运行,而后者则展现了感知和理解各类语音信号的能力,使得用户可以基于音频进行更为广泛的创作和逻辑推理。

至此,阿里云完成了 18 亿、70 亿、140 亿、720 亿参数的四款大语言模型,以及视觉和音频理解两款多模态大模型的全面开源,真正实现了“全尺寸、全模态”的开放愿景。

阿里云 CTO 周靖人指出,开源生态是推动中国大模型技术进步与应用落地的关键因素。通义千问的持续开源不仅彰显了阿里云“ AI 时代最开放的大模型”的愿景,也为参与者提供了共同促进大模型生态建设的平台。

发布会上,阿里云不仅公布了 720 亿参数的 Qwen-72B 开源的重磅消息,同时揭幕了一项重大赛事——首届“通义千问 AI 挑战赛”。

“通义千问 AI 挑战赛”简介

本届比赛由阿里云和 NVIDIA 英伟达联合发起,携手魔搭社区、天池平台等共同承办,比赛为开发者提供了免费体验和深度挖掘通义开源模型家族能力的机会。主办方为参赛者提供了比赛专属高达 50 万元的云上算力支持,同时还设有丰厚的奖金,以激励参赛者在技术探索和创新方面取得突破。

赛事分为算法和 Agent 两大赛道,前者专注于对通义千问大模型的微调训练,目标是通过优质数据挖掘模型的潜在代码能力;后者则是鼓励开发者利用通义千问大模型,结合魔搭社区提供的 Agent-Builder 框架,开发出行业领先的新一代 AI 应用,推进大模型在各个行业的实际部署。

开发者们已可以通过天池平台报名参加这场 AI 盛事,这不仅是一个展示个人技术实力的舞台,更是一个实践和实现AI商业化应用的绝佳机会,旨在将大模型的理论潜力转化为实际效能,进而促进整个行业的技术进步和创新发展。

赛题说明

赛道一:Code Qwen能力算法赛道

详细参赛信息请搜索“通义千问 AI 挑战赛 - Code Qwen 能力算法赛道”

赛题背景

聚焦于通义千问大模型微调训练的竞赛,其主要目标是通过高质量的代码实践数据探索和拓展开源模型 Qwen- 1.8B 、及 Qwen- 72B 的模型代码能力上限。

赛题赛制

【初赛阶段 - 小试牛刀 1.8B】2023年12月5日10:00-2023年12月18日18:00,UTC+8

初赛阶段主要聚焦在如何通过 SFT 提升基础模型的代码能力。需要选手基于最新开源的 Qwen -1.8B 模型作为基础模型,在主办方我们提供的训练框架上自行进行数据收集与微调,训练完成后将进行自动评估,返回最终结果进行排名。

【复赛阶段 - 八仙过海 72B】2023年12月20日18:00-2023年12月28日12:00,UTC+8

复赛阶段我们将提供 GPU 算力(在线 API 的方式),参赛队伍将基于 Qwen-72B 模型进行 PEFT (lora)进行训练;

复赛评测采用混合评测方式,评测时间为2023年12月20日18:00-2023年12月28日12:00,复赛的评测集为初赛公开数据集分数 * 0.5 + 隐藏的代码 QA 数据集 * 0.5。

奖励奖项

本次竞赛奖金池共计 9.5 万元人民币现金奖励(税前),具体奖励如下:

冠军(1名): 30000 元人民币奖金,亚军(1名):20000 元人民币奖金,季军(1名):10000 元人民币奖金,优胜奖(7名):5000 元人民币奖金;获奖者均颁发获奖证书。

赛道二:Agent Builder 创意挑战赛道

详细参赛信息请搜索“通义千问 AI 挑战赛 - Agent Builder 创意挑战赛道”

赛题说明

本赛道为开放赛题,基于魔搭社区开源 Agent-builder 框架和通义千问模型,使用魔搭创空间和官方操作指引,搭建基于通义千问的新一代 AI 应用 Demo,要求应用主题方向不违反法律、道德、公序良俗;

初赛 - 人气争夺战 2023年12月1日 10:00:00 —— 2023年12月20日 18:00:00,UTC+8

线上赛主要聚焦在如何通过通义千问模型和 Agent-builder 框架,创新各种各样的 AI Agent 应用。参赛选手在天池平台报名后,需将参赛 Agent 在魔搭社区-创空间部署,魔搭将针对选手的作品做宣传推广,并设相应奖励。

线上人气评选规则:大赛组委会将根据作品上线后截止12月21日 23:59:59 期间的“喜欢量”,两方面因素进行评选奖项,具体如下:

奖项 评选标准 奖品 数量
最佳人气奖 作品”喜欢量“排名第1名 奖金3000元人民币(税前)+证书 1
优秀人气奖 作品”喜欢量“排名第2-3名 奖金2000元人民币(税前)+证书 2
人气作品奖 作品”喜欢量“排名第4-10名 奖金1000元人民币(税前)+证书 7
参与奖 公开作品中随机抽取10名 魔搭社区周边礼包 10

4.初赛晋级规则:2023年12月20日 —— 2023年12月22日期间,由大赛专业评委将从提交的 Agent 作品的 技术难度、应用前景、交互体验、人气值等维度进行综合评审打分,遴选得分最高的 10 支作品团队进入复赛答辩环节,入选团队需经过评委技术审核。

复赛 - 最佳应用,2023年12月26日,UTC+8(具体时段留意组委会通知)

复赛阶段选手们将通过线上答辩的方式来路演展示 Agent 作品,专业评委会根据内容评选本次比赛的获奖团队;评选方案:复赛采取答辩和主观评审方式>

3.复赛最终评选奖项如下:

奖项 奖品 数量
最佳应用奖 奖金20000元人民币(税前)+证书 1
最佳创意奖 奖金10000元人民币(税前)+证书 1
Qwen最佳应用奖 奖金10000元人民币(税前)+证书 1
NVIDIA技术奖 奖金10000元人民币(税前)+证书 1
优秀应用奖 奖金2000元人民币(税前)+证书 5
魔搭最佳应用奖 奖金10000元人民币(税前)+证书 1

NVIDIA 作为联合主办方,对上述赛题提供了相关 AI 软件栈的信息作为参考和学习资料:

NVIDIA 企业开发者社区主要面向 GPU 开发者,分享 NVIDIA GPU 以及开发工具、AI 框架或者平台等相关开发技术经验。开发者可以免费加入 NVIDIA 开发者计划,免费访问 150 多种 SDKs 和模型、参与各类技术在线研讨会以及浏览如技术博客、白皮书、教程等技术资源。加入 NVIDIA 开发者计划:++https://developer.nvidia.cn/developer-program?ncid=ref-kc-482309-vt04++

  1. NVDIA TensorRT^TM^ 8.6.1 版本视频教程:++https: //www.bilibili.com/video/BV1jj411Z7wG++
  2. 大语言模型推理优化引擎 NVIDIA TensorRT-LLM:
  1. 通过 NGC Catalog 企业级容器服务获取预训练的 AI 模型以及 AI 软件:++https: //catalog.ngc.nvidia.com/++
相关文章
|
7天前
|
人工智能 语音技术 开发者
千问max#百炼AI实训课作业#科幻小说家
根据教程一步步操作确实有趣,尤其是语音识别的准确度很高,带来了很好的开发体验。通过详细步骤引导,开发者可以轻松上手并实现高质量的语音交互功能。
|
3天前
|
人工智能 JavaScript 测试技术
通义灵码 2.0 体验报告:AI 赋能智能研发的新范式
通义灵码 2.0 是阿里云基于通义大模型推出的先进开发工具,具备代码智能生成、研发问答、多文件修改和自主执行等核心功能。本文通过亲身体验,展示了其在新功能开发、跨语言编程和单元测试生成等方面的实际效果,并对比了 1.0 版本的改进。结果显示,2.0 版在代码生成完整度、跨语言支持和单元测试自动化上有显著提升,极大提高了开发效率,但仍需进一步优化安全性和个性化风格。推荐指数:⭐⭐⭐⭐⭐。
|
3天前
|
人工智能 JavaScript 测试技术
通义灵码 2.0 体验报告:AI 赋能智能研发的新范式
**通义灵码 2.0 体验报告:AI 赋能智能研发的新范式** 本文详细评测了阿里云推出的通义灵码 2.0,基于通义大模型,提供代码智能生成、研发问答、多文件修改等核心能力。通过亲身体验,探讨其在新功能开发、跨语言编程、单元测试生成等场景的实际效果,并对比1.0版本的改进点。结果显示,2.0版本在代码生成完整性、自动化程度及跨语言支持方面有显著提升,但也存在安全性优化和个性化风格调整的空间。推荐指数:⭐⭐⭐⭐⭐。 (239字)
|
12天前
|
人工智能 自然语言处理 搜索推荐
浙大通义联手推出慢思考长文本生成框架OmniThink,让AI写作突破知识边界
随着大模型(LLMs)的发展,AI 写作取得了较大进展。然而,现有的方法大多依赖检索知识增强生成(RAG)和角色扮演等技术,其在信息的深度挖掘方面仍存在不足,较难突破已有知识边界,导致生成的内容缺乏深度和原创性。
|
3天前
|
人工智能 IDE 测试技术
通义灵码 AI 程序员(版本2.0)测评文档
《通义灵码 2.0 测评文档》概述了该工具在AI程序员交互、多文件代码修改、单元测试生成、多轮对话及快照管理等方面的核心功能评估。通过实际测试,验证其提高开发效率、减少重复劳动和提升代码质量的效果。测评涵盖Windows系统与JetBrains IDE环境,针对插件版本2.0.0进行详细的功能测试,包括需求解析准确性、跨文件修改稳定性、单元测试自动生成及用户界面设计等。总结指出,通义灵码 2.0 在多文件修改、单元测试生成和用户体验方面表现出色,但在复杂需求解析和大规模项目性能上仍有改进空间。
70 19
|
7天前
|
人工智能 自然语言处理 程序员
无编程经验小白如何玩转通义灵码 AI 程序员,让写代码像聊天一样简单
没有编程经验的小白如何玩转通义灵码 AI 程序员,让写代码像聊天一样简单
153 22
|
5天前
|
人工智能 Java 程序员
【AI程序员】通义灵码 AI 程序员全面上线JAVA使用体验
通过 AI 程序编写一个JAVA后台项目登陆页面
144 17
|
27天前
|
存储 人工智能 自然语言处理
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架,通过模拟人类迭代扩展和反思过程,生成高质量长篇文章,显著提升知识密度和内容深度。
163 12
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
|
6天前
|
人工智能 小程序 程序员
【视频测评 DEMO 参考】VSCode 神级 AI 插件通义灵码:完全免费+实战教程+微信贪吃蛇小程序
VSCode 神级 AI 插件通义灵码:完全免费+实战教程+微信贪吃蛇小程序
103 7
|
13天前
|
人工智能 IDE 程序员
通义灵码 2.0 AI 程序员下载安装
通义灵码2.0 AI程序员支持JetBrains IDEs、Visual Studio Code及远程开发场景,暂不支持Visual Studio。用户可通过插件市场搜索“TONGYI Lingma”安装,确保版本升级至2.0以上。安装后登录阿里云账号即可使用,个人版和企业版均免费。新手可参考官方指南进行IDE安装配置。
560 9