寒假充电计划第一弹 | 打榜数据集等你来战

简介: 寒假充电计划第一弹 | 打榜数据集等你来战

常在天池冲浪,哪能没看到过打榜数据集呢~又是一年寒假时,小萌喵思前想后,觉得这样优秀的学习机会不该私藏,今天就给大家介绍介绍天池的打榜数据集,寒假一起卷死别人提升自己!

今天萌喵给大家介绍3个天池经典榜单,分别涉及多模态NLP决策智能领域的技术。这些优质榜单不仅为大家提供来自真实业务场景的宝贵数据集,还提供了学习论文和baseline代码,同学们可以打榜PK拿礼品。


MUGE

大规模中文多模态评测基准


要说当下什么研究方向最火热,萌喵认为多模态技术必属其一,毕竟多模态技术在实际业务中有非常自然的落地场景。谷歌AI大神Jeff Dean在2020年就提出多模态研究将会是未来研究的大势所趋。

当前多模态领域的数据集多以英文为主,并且缺乏一个可在不同场景、不同任务类型设置下全面评估模型性能的评测基准。在此背景下,达摩院M6团队联合浙江大学和阿里云天池平台,在中国计算机学会计算机视觉专委会(CCF-CV)的协助下,共同推出了业界首个中文多模态评测基准MUGE。

image.png

MUGE拥有当前最大规模的中文多模态评测数据集,覆盖多种类型的任务,包括图文描述基于文本的图像生成跨模态检索3个典型的多模态任务,萌喵带着大家一起瞅瞅~

1. 图文描述(Image Caption)
根据一张图像生成相应的文字描述,要求生成的描述须如实反映图中的物体以及关键细节,举例康康:

image.png

2. 基于文本的图像生成(Text to Image)
根据一段文本描述,生成符合相应描述的图像,同时要求图像清晰且逼真。举🌰:

image.png

3. 多模态检索(Multimodal Retrieval)

MUGE准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品,请注意,所有的商品图片都没有文本标题哦,因此任务更聚焦在跨模态的表征学习。我们一起看个例子:

image.png

看完任务介绍,是不是已经有大佬摩拳擦掌了?

榜单在此:https://tianchi.aliyun.com/muge

刚接触多模态研究的小伙伴也不要慌!我们也提供了Baseline供大家上手学习:https://github.com/MUGE-2021


CBLUE

中文医疗健康信息处理评测基准


疫情反反复复,影响到我们生活的诸多方面,我们期待AI技术能在医疗场景发挥价值。

CBLUE由中国中文信息学会医疗健康与生物信息处理专业委员会发起,由阿里云天池承办,并由国内诸多从事医疗AI研究的高校、企业和研究机构共同推出,是国内首个公开的中文医疗自然语言处理领域评测基准。CBLUE的目标是为了推动“医学信息学+AI”跨学科技术的发展,并助力健康中国战略。

image.png

CBLUE挑战榜覆盖了5大类医学信息处理任务,包括:医学文本信息抽取、医学术语归一化、医学文本分类、医学句子语义匹配和医疗对话理解与生成,覆盖了常见的自然语言处理任务,对模型的泛化能力提出了很高的要求。萌喵绘制了一张思维导图方便大家查询:

image.png

目前CBLUE已有接近400组选手提交打榜,是天池平台最热门的打榜数据集,感兴趣的宝子们快来挑战吧:https://tianchi.aliyun.com/cblue

我们也放出baseline代码供大家学习切磋:https://github.com/CBLUEbenchmark/CBLUE


RABBO

黑盒优化评测基准


生活中处处都有数学的影子,运筹决策技术在我们生活中扮演着重要的作用,比如物流智能调度。接下来介绍的这个数据集榜单,喵萌希望带大家一起来做场思维体操~

黑盒优化,泛指目标函数难以从数学上解析表达,缺少可直接利用的梯度信息,仅可利用目标函数输入和对应输出函数值进行最优解搜索的优化问题。这个解释是不是比较烧脑呢?别着急 ,萌喵带大家看两个有体感的例子:

image.png

1. 金属冶炼配比优化:传统制造业中存在大量原料配比优化的问题场景,我们需要通过优化生产材料的配比使产品达到质量要求的同时控制生产过程中能源消耗等成本。该类配比优化问题往往内在机理、生产流程复杂,通过进行经验性的配比实验搜索最优方案难度较大,代价极高。

2. 风场微观选址:风能作为新能源中的一种,具有安全性高、储量巨大,分布极广的优点。近年来,风力发电技术也得到了迅速发展与推广。风机微观选址问题旨在通过优化每台风力发电机组在风电场的位置,最大限度利用风能,降低风机尾流效应带来的影响,最大化风场发电量。

从以上例子中我们可以直观的感受到此类问题的目标函数很难从数学上解析表达,RABBO(Real-Aplication  Black-Box Optimization  benchmark)就是在这样的背景下产生的,包含了160多个经典的黑盒优化问题。通过提供具有实际应用背景的黑盒优化测试问题及评测方案,目标是帮助研究人员来打磨求解真实场景问题的黑盒优化算法。

image.png

RABBO榜单由达摩院决策智能实验室倾力维护,实行长期线上评测,目标是为领域内研发团队提供一个“研发工具”和“竞技平台”,打造国内外最具活力的的黑盒优化Benchmark榜单。小伙伴们快来挑战吧:https://tianchi.aliyun.com/rabbo,悄悄告诉大家,RABBO打榜优胜的选手可以获得达摩院的绿通offer噢~

看完这些数据集,你是不是也跟萌喵一样搓手手跃跃欲试了呢?快来充电打榜吧,下一匹黑马也许就是你~

老规矩!在后台回复:打榜数据集就可以一键get文本中所有的链接开始打榜了!

相关文章
|
6天前
|
人工智能 自然语言处理 算法
当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”
【2月更文挑战第24天】当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”
27 2
当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”
|
6天前
|
人工智能 网络协议 物联网
重拾计网-第一弹
重拾计网-第一弹
星际争霸之小霸王之小蜜蜂(五)--为小蜜蜂降速
星际争霸之小霸王之小蜜蜂(五)--为小蜜蜂降速
|
人工智能 自然语言处理 搜索推荐
ChatGPT再出“王炸”,客服都要下岗了?
ChatGPT再出“王炸”,客服都要下岗了?
268 0
|
人工智能 数据库
热爱英式早餐和烤鸭,点了杯酒保都没听过的酒…细数ChatGPT控制我生活的24小时
热爱英式早餐和烤鸭,点了杯酒保都没听过的酒…细数ChatGPT控制我生活的24小时
172 0
单片机比赛准备07-蓝桥杯-第五届初赛模拟题(模拟智能灌溉装置)
单片机比赛准备07-蓝桥杯-第五届初赛模拟题(模拟智能灌溉装置)
57 0
单片机比赛准备07-蓝桥杯-第五届初赛模拟题(模拟智能灌溉装置)
|
算法
每日一题冲刺大厂第十九天 小车车
大家好,我是泡泡,给大家带来每日一题的目的是为了更好的练习算法,我们的每日一题为了让大家练到各种各样的题目,熟悉各种题型,一年以后,蜕变成为一个不一样的自己!
62 0
|
人工智能 搜索推荐 开发者
即将发布的2021年度「Pop SOTA!」名录是否漏了贵组的重要工作?速来查缺补漏~
即将发布的2021年度「Pop SOTA!」名录是否漏了贵组的重要工作?速来查缺补漏~
即将发布的2021年度「Pop SOTA!」名录是否漏了贵组的重要工作?速来查缺补漏~
|
存储 安全 内存技术
20美元的宜家台灯算力有多强?运行《毁灭战士》操作丝滑,最初竟是受假新闻启发
20美元的宜家台灯算力有多强?运行《毁灭战士》操作丝滑,最初竟是受假新闻启发
143 0
|
机器人
苏黎世联邦理工研发轮式“机器狗”,可走可溜,官方吐槽:爬楼梯有点费劲
苏黎世联邦理工研发轮式“机器狗”,可走可溜,官方吐槽:爬楼梯有点费劲
163 0