寒假充电计划第一弹 | 打榜数据集等你来战

2022-01-29 252

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 寒假充电计划第一弹 | 打榜数据集等你来战

常在天池冲浪，哪能没看到过打榜数据集呢~又是一年寒假时，小萌喵思前想后，觉得这样优秀的学习机会不该私藏，今天就给大家介绍介绍天池的打榜数据集，寒假一起~~卷死别人~~提升自己！

今天萌喵给大家介绍3个天池经典榜单，分别涉及多模态、NLP和决策智能领域的技术。这些优质榜单不仅为大家提供来自真实业务场景的宝贵数据集，还提供了学习论文和baseline代码，同学们可以打榜PK拿礼品。

MUGE

大规模中文多模态评测基准

要说当下什么研究方向最火热，萌喵认为多模态技术必属其一，毕竟多模态技术在实际业务中有非常自然的落地场景。谷歌AI大神Jeff Dean在2020年就提出多模态研究将会是未来研究的大势所趋。

当前多模态领域的数据集多以英文为主，并且缺乏一个可在不同场景、不同任务类型设置下全面评估模型性能的评测基准。在此背景下，达摩院M6团队联合浙江大学和阿里云天池平台，在中国计算机学会计算机视觉专委会（CCF-CV）的协助下，共同推出了业界首个中文多模态评测基准MUGE。

MUGE拥有当前最大规模的中文多模态评测数据集，覆盖多种类型的任务，包括图文描述、基于文本的图像生成、跨模态检索3个典型的多模态任务，萌喵带着大家一起瞅瞅～

1. 图文描述（Image Caption）
根据一张图像生成相应的文字描述，要求生成的描述须如实反映图中的物体以及关键细节，举例康康：

2. 基于文本的图像生成（Text to Image）
根据一段文本描述，生成符合相应描述的图像，同时要求图像清晰且逼真。举🌰：

3. 多模态检索（Multimodal Retrieval）

MUGE准备了来自于淘宝电商平台的真实搜索query及商品图，要求模型从给定的商品池中检索出与搜索query相匹配的商品，请注意，所有的商品图片都没有文本标题哦，因此任务更聚焦在跨模态的表征学习。我们一起看个例子：

看完任务介绍，是不是已经有大佬摩拳擦掌了？

榜单在此：https://tianchi.aliyun.com/muge

刚接触多模态研究的小伙伴也不要慌！我们也提供了Baseline供大家上手学习：https://github.com/MUGE-2021

CBLUE

中文医疗健康信息处理评测基准

疫情反反复复，影响到我们生活的诸多方面，我们期待AI技术能在医疗场景发挥价值。

CBLUE由中国中文信息学会医疗健康与生物信息处理专业委员会发起，由阿里云天池承办，并由国内诸多从事医疗AI研究的高校、企业和研究机构共同推出，是国内首个公开的中文医疗自然语言处理领域评测基准。CBLUE的目标是为了推动“医学信息学+AI”跨学科技术的发展，并助力健康中国战略。

CBLUE挑战榜覆盖了5大类医学信息处理任务，包括：医学文本信息抽取、医学术语归一化、医学文本分类、医学句子语义匹配和医疗对话理解与生成，覆盖了常见的自然语言处理任务，对模型的泛化能力提出了很高的要求。萌喵绘制了一张思维导图方便大家查询：

目前CBLUE已有接近400组选手提交打榜，是天池平台最热门的打榜数据集，感兴趣的宝子们快来挑战吧：https://tianchi.aliyun.com/cblue

我们也放出baseline代码供大家学习切磋：https://github.com/CBLUEbenchmark/CBLUE

RABBO

黑盒优化评测基准

生活中处处都有数学的影子，运筹决策技术在我们生活中扮演着重要的作用，比如物流智能调度。接下来介绍的这个数据集榜单，喵萌希望带大家一起来做场思维体操～

黑盒优化，泛指目标函数难以从数学上解析表达，缺少可直接利用的梯度信息，仅可利用目标函数输入和对应输出函数值进行最优解搜索的优化问题。这个解释是不是比较烧脑呢？别着急，萌喵带大家看两个有体感的例子：

1. 金属冶炼配比优化：传统制造业中存在大量原料配比优化的问题场景，我们需要通过优化生产材料的配比使产品达到质量要求的同时控制生产过程中能源消耗等成本。该类配比优化问题往往内在机理、生产流程复杂，通过进行经验性的配比实验搜索最优方案难度较大，代价极高。

2. 风场微观选址：风能作为新能源中的一种，具有安全性高、储量巨大，分布极广的优点。近年来，风力发电技术也得到了迅速发展与推广。风机微观选址问题旨在通过优化每台风力发电机组在风电场的位置，最大限度利用风能，降低风机尾流效应带来的影响，最大化风场发电量。

从以上例子中我们可以直观的感受到此类问题的目标函数很难从数学上解析表达，RABBO（Real-Aplication Black-Box Optimization benchmark）就是在这样的背景下产生的，包含了160多个经典的黑盒优化问题。通过提供具有实际应用背景的黑盒优化测试问题及评测方案，目标是帮助研究人员来打磨求解真实场景问题的黑盒优化算法。

RABBO榜单由达摩院决策智能实验室倾力维护，实行长期线上评测，目标是为领域内研发团队提供一个“研发工具”和“竞技平台”，打造国内外最具活力的的黑盒优化Benchmark榜单。小伙伴们快来挑战吧：https://tianchi.aliyun.com/rabbo，悄悄告诉大家，RABBO打榜优胜的选手可以获得达摩院的绿通offer噢~

看完这些数据集，你是不是也跟萌喵一样搓手手跃跃欲试了呢？快来充电打榜吧，下一匹黑马也许就是你~

老规矩！在后台回复：打榜数据集就可以一键get文本中所有的链接开始打榜了！

寒假充电计划第一弹 | 打榜数据集等你来战

天池大数据科研平台

热门文章

最新文章

相关课程

相关电子书

相关实验场景