第四届 Data-Juicer数据挑战赛暨天池 Better Synth 多模态大模型数据合成挑战赛

简介: 阿里云、NVIDIA主办,阿里云天池平台、魔搭社区、阿里巴巴通义实验室共同组织的第四届 Data-Juicer 数据挑战赛,暨天池 Better Synth 多模态大模型数据合成挑战赛开赛啦~

阿里云、NVIDIA主办,阿里云天池平台、魔搭社区、阿里巴巴通义实验室共同组织的第四届 Data-Juicer 数据挑战赛,暨天池 Better Synth 多模态大模型数据合成挑战赛开赛啦~

赛事简介🎉

这一次我们有了新的帮手,我们除了可以自行清洗数据原材料外,还必须借助已有大模型的创造能力,合成与创造出一些新的美味食材,并探究尚处于嗷嗷待哺的多模态大模型对这些模型前辈们创新性合成出来的数据佳肴是否能很好地吸收并茁壮成长。

为了助力美味佳肴的制作与创造,Data-Juicer 再次赋能,提供诸多便捷的多模态数据合成工具和算子(如基于BLIP-2模型的图片描述文本算子,以及基于Stable Diffusion模型的文生图/文改图算子等),让您能快速上手,合成出一批创新性食材,并通过数据菜谱讲它们整合到您的美味佳肴中。此外,得益于 NVIDIA 的开源大语言模型推理加速库 TensorRT-LLM 和近期发布的 NVIDIA TensorRT 10.0 提供的综合性模型优化库 TensorRT-Model-Optimizer ,线下赛选手们可以探索如何最大效率地利用大模型合成大量优质数据,以快速迭代数据合成方案。

在此次竞赛中,参赛者们都将面对相同的挑战规则,包括基础模型、训练算法、种子数据集等,确保大家能够公平竞争。竞赛中并不需要大量的计算硬件支持,一台单卡机器即可让您参与到其中。参与者不仅有望赢得多达13万元现金奖励,还有机会获得丰富的参与奖、纪念奖等奖项,最最重要的是有机会能够来到线下与来自各个高校与企业的队伍面对面同台竞技,进行技术与学术上的切磋与交流。

赛程安排⏰

🔹报名组队:即日起—2024年8月16日18:00

🔹线上赛:即日起(报名之日)—2024年8月23日18:00

🔹线下赛既“天池AI奇点技术闭门会”:2024年9月2日9:00—2024年9月6日  

注:排名前十的队伍进入线下赛环节,举办地点为北京,主办方为线下团队提供参赛证明,以便选手请假使用。

进入线下赛的团队,组委会将为每名成员提供1000元交通补助,参加技术沙龙期间的住宿和餐饮,将由主办方统一提供

奖项设置🏆

本次竞赛奖金池共计130000元人民币现金奖励(税前),具体奖励如下:

🥇冠军(第1名):

50000元人民币奖金,颁发获奖证书

🥈亚军(第2~3名):

20000元人民币奖金,颁发获奖证书

🥉季军(第4~6名):

10000元人民币奖金,颁发获奖证书

优胜奖(第7~10名):

2500元人民币奖金,颁发获奖证书

纪念奖:所有进入线下赛选手都将获得由主办方提供的智能充电器或小电拼等纪念品。

参与奖:线上赛排名 11-40 名的团队每名成员,将获得阿里云茶具1套或拍拍灯1个。

分享奖:社区发帖分享解决方案并通过审核的团队,团队每名成员将获得天猫精灵方糖1台。

是时候展现你在合成数据对多模态大模型影响层面的思考与实践了,第四届 Data-Juicer 大模型数据挑战赛正式开启。快来加入我们的队伍,共同掀起合成数据与多模态大模型相互作用中从0-1以及从1-100的前沿创新探索吧!更多详细信息,敬请访问我们的比赛官网。期待您的精彩参与!


比赛官网:https://tianchi.aliyun.com/competition/entrance/532251

Data-Juicer 开源代码:https://github.com/modelscope/data-juicer

相关文章
|
17天前
|
机器学习/深度学习 人工智能 计算机视觉
ConsisID:北大联合鹏城实验室等机构推出的文本到视频生成模型
ConsisID是由北京大学和鹏城实验室等机构联合推出的文本到视频生成模型,专注于保持视频中人物身份的一致性。该模型采用频率分解技术和免调优的Diffusion Transformer架构,能够在多个评估维度上超越现有技术,推动身份一致性视频生成技术的发展。
135 73
ConsisID:北大联合鹏城实验室等机构推出的文本到视频生成模型
|
9天前
|
人工智能 算法 测试技术
Insight-V:腾讯联合南洋理工、清华大学推出提升长链视觉推理能力的多模态模型
Insight-V是由南洋理工大学、腾讯公司和清华大学联合推出的多模态模型,旨在提升长链视觉推理能力。通过渐进式数据生成、多智能体系统和两阶段训练流程,Insight-V在多个视觉推理基准测试中表现出色,展现出强大的视觉推理能力。
83 42
Insight-V:腾讯联合南洋理工、清华大学推出提升长链视觉推理能力的多模态模型
|
24天前
|
人工智能 API
EvolveDirector:阿里联合南洋理工推出文本到图像生成模型的高效训练技术
EvolveDirector是由阿里巴巴和南洋理工大学联合推出的文本到图像生成模型的高效训练技术。该框架通过与高级模型的API交互获取数据对,并利用预训练的大型视觉语言模型(VLMs)动态优化训练数据集,显著减少了数据量和训练成本。EvolveDirector能够从多个高级模型中选择最佳样本进行学习,使最终训练出的模型在多个方面超越现有高级模型。
39 0
EvolveDirector:阿里联合南洋理工推出文本到图像生成模型的高效训练技术
|
4月前
|
人工智能 数据库
【科研技巧】如何判断某个期刊是什么类别及影响因子?是否是顶会?如何期刊内检索?AI写综述?AI做PPT?
本文提供了关于如何判断期刊类别、影响因子,识别顶级会议,以及在期刊内部进行检索的科研技巧,并探讨了AI技术在撰写综述和制作PPT方面的应用。
163 6
【科研技巧】如何判断某个期刊是什么类别及影响因子?是否是顶会?如何期刊内检索?AI写综述?AI做PPT?
|
6月前
|
算法 数据挖掘 数据处理
第三届 Data-Juicer 数据挑战赛:ModelScope-Sora“数据导演”创意竞速
欢迎进入第三届 Data-Juicer 数据挑战赛:“ModelScope-Sora 文生视频大模型数据挑战赛”。
|
SQL 存储 人工智能
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
190 0
|
机器学习/深度学习 人工智能 监控
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
161 0
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:50-15:30吴玺宏教授《一种具身自监督学习框架:面向任何语种语音的音系构建任务》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:50-15:30吴玺宏教授《一种具身自监督学习框架:面向任何语种语音的音系构建任务》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:50-15:30吴玺宏教授《一种具身自监督学习框架:面向任何语种语音的音系构建任务》
|
机器学习/深度学习 人工智能 自然语言处理
AI:2020年6月22日北京智源大会演讲分享之10:40-11:10Daniel教授《 可微分的加权有限状态机及其机器学习应用》、11:10何晓冬教授《启动“智源-京东”任务导向多模态对话大赛》
AI:2020年6月22日北京智源大会演讲分享之10:40-11:10Daniel教授《 可微分的加权有限状态机及其机器学习应用》、11:10何晓冬教授《启动“智源-京东”任务导向多模态对话大赛》
AI:2020年6月22日北京智源大会演讲分享之10:40-11:10Daniel教授《 可微分的加权有限状态机及其机器学习应用》、11:10何晓冬教授《启动“智源-京东”任务导向多模态对话大赛》
|
机器学习/深度学习 人工智能 算法
旷视联合智源发布全球最大物体检测数据集Objects365,举办CVPR DIW2019挑战赛
4 月 16 日,北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI,2018 年 11 月 14 日成立)在北京会议中心召开了「智源学者计划暨联合实验室发布会」。
492 0
旷视联合智源发布全球最大物体检测数据集Objects365,举办CVPR DIW2019挑战赛
下一篇
DataWorks