寒假充电计划第一弹 | 打榜数据集等你来战

简介: 寒假充电计划第一弹 | 打榜数据集等你来战

常在天池冲浪,哪能没看到过打榜数据集呢~又是一年寒假时,小萌喵思前想后,觉得这样优秀的学习机会不该私藏,今天就给大家介绍介绍天池的打榜数据集,寒假一起卷死别人提升自己!

今天萌喵给大家介绍3个天池经典榜单,分别涉及多模态NLP决策智能领域的技术。这些优质榜单不仅为大家提供来自真实业务场景的宝贵数据集,还提供了学习论文和baseline代码,同学们可以打榜PK拿礼品。


MUGE

大规模中文多模态评测基准


要说当下什么研究方向最火热,萌喵认为多模态技术必属其一,毕竟多模态技术在实际业务中有非常自然的落地场景。谷歌AI大神Jeff Dean在2020年就提出多模态研究将会是未来研究的大势所趋。

当前多模态领域的数据集多以英文为主,并且缺乏一个可在不同场景、不同任务类型设置下全面评估模型性能的评测基准。在此背景下,达摩院M6团队联合浙江大学和阿里云天池平台,在中国计算机学会计算机视觉专委会(CCF-CV)的协助下,共同推出了业界首个中文多模态评测基准MUGE。

image.png

MUGE拥有当前最大规模的中文多模态评测数据集,覆盖多种类型的任务,包括图文描述基于文本的图像生成跨模态检索3个典型的多模态任务,萌喵带着大家一起瞅瞅~

1. 图文描述(Image Caption)
根据一张图像生成相应的文字描述,要求生成的描述须如实反映图中的物体以及关键细节,举例康康:

image.png

2. 基于文本的图像生成(Text to Image)
根据一段文本描述,生成符合相应描述的图像,同时要求图像清晰且逼真。举🌰:

image.png

3. 多模态检索(Multimodal Retrieval)

MUGE准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品,请注意,所有的商品图片都没有文本标题哦,因此任务更聚焦在跨模态的表征学习。我们一起看个例子:

image.png

看完任务介绍,是不是已经有大佬摩拳擦掌了?

榜单在此:https://tianchi.aliyun.com/muge

刚接触多模态研究的小伙伴也不要慌!我们也提供了Baseline供大家上手学习:https://github.com/MUGE-2021


CBLUE

中文医疗健康信息处理评测基准


疫情反反复复,影响到我们生活的诸多方面,我们期待AI技术能在医疗场景发挥价值。

CBLUE由中国中文信息学会医疗健康与生物信息处理专业委员会发起,由阿里云天池承办,并由国内诸多从事医疗AI研究的高校、企业和研究机构共同推出,是国内首个公开的中文医疗自然语言处理领域评测基准。CBLUE的目标是为了推动“医学信息学+AI”跨学科技术的发展,并助力健康中国战略。

image.png

CBLUE挑战榜覆盖了5大类医学信息处理任务,包括:医学文本信息抽取、医学术语归一化、医学文本分类、医学句子语义匹配和医疗对话理解与生成,覆盖了常见的自然语言处理任务,对模型的泛化能力提出了很高的要求。萌喵绘制了一张思维导图方便大家查询:

image.png

目前CBLUE已有接近400组选手提交打榜,是天池平台最热门的打榜数据集,感兴趣的宝子们快来挑战吧:https://tianchi.aliyun.com/cblue

我们也放出baseline代码供大家学习切磋:https://github.com/CBLUEbenchmark/CBLUE


RABBO

黑盒优化评测基准


生活中处处都有数学的影子,运筹决策技术在我们生活中扮演着重要的作用,比如物流智能调度。接下来介绍的这个数据集榜单,喵萌希望带大家一起来做场思维体操~

黑盒优化,泛指目标函数难以从数学上解析表达,缺少可直接利用的梯度信息,仅可利用目标函数输入和对应输出函数值进行最优解搜索的优化问题。这个解释是不是比较烧脑呢?别着急 ,萌喵带大家看两个有体感的例子:

image.png

1. 金属冶炼配比优化:传统制造业中存在大量原料配比优化的问题场景,我们需要通过优化生产材料的配比使产品达到质量要求的同时控制生产过程中能源消耗等成本。该类配比优化问题往往内在机理、生产流程复杂,通过进行经验性的配比实验搜索最优方案难度较大,代价极高。

2. 风场微观选址:风能作为新能源中的一种,具有安全性高、储量巨大,分布极广的优点。近年来,风力发电技术也得到了迅速发展与推广。风机微观选址问题旨在通过优化每台风力发电机组在风电场的位置,最大限度利用风能,降低风机尾流效应带来的影响,最大化风场发电量。

从以上例子中我们可以直观的感受到此类问题的目标函数很难从数学上解析表达,RABBO(Real-Aplication  Black-Box Optimization  benchmark)就是在这样的背景下产生的,包含了160多个经典的黑盒优化问题。通过提供具有实际应用背景的黑盒优化测试问题及评测方案,目标是帮助研究人员来打磨求解真实场景问题的黑盒优化算法。

image.png

RABBO榜单由达摩院决策智能实验室倾力维护,实行长期线上评测,目标是为领域内研发团队提供一个“研发工具”和“竞技平台”,打造国内外最具活力的的黑盒优化Benchmark榜单。小伙伴们快来挑战吧:https://tianchi.aliyun.com/rabbo,悄悄告诉大家,RABBO打榜优胜的选手可以获得达摩院的绿通offer噢~

看完这些数据集,你是不是也跟萌喵一样搓手手跃跃欲试了呢?快来充电打榜吧,下一匹黑马也许就是你~

老规矩!在后台回复:打榜数据集就可以一键get文本中所有的链接开始打榜了!

相关文章
|
Web App开发 编解码 监控
防御性设计和开发
“防御性编程(Defensive programming)是防御式设计的一种具体体现,它是为了保证,对程序的不可预见的使用,不会造成程序功能上的损坏。它可以被看作是为了减少或消除墨菲定律效力的想法。”
1327 0
防御性设计和开发
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在医疗诊断中的应用与前景####
本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状、面临的挑战及未来发展趋势。通过分析AI如何辅助医生进行疾病诊断,提高诊断效率和准确性,以及其在个性化医疗中的潜力,文章揭示了AI技术对医疗行业变革的推动作用。同时,也指出了数据隐私、算法偏见等伦理问题,并展望了AI与人类医生协同工作的前景。 ####
936 0
|
计算机视觉 Python
Python实用记录(一):如何将不同类型视频按关键帧提取并保存图片,实现图片裁剪功能
这篇文章介绍了如何使用Python和OpenCV库从不同格式的视频文件中按关键帧提取图片,并展示了图片裁剪的方法。
632 0
|
11月前
|
人工智能 自然语言处理 搜索推荐
HiFox AI:一站式 AI 应用平台,多模型快速接入,自由选用
HiFox AI 是一站式AI应用平台,整合了30多个主流AI模型,提供文本生成、对话交流、图片生成等多种应用场景。平台内置1000+预构建AI应用,支持无代码搭建个性化应用和复杂工作流,帮助用户高效处理重复任务,显著提升工作效率。无论是普通用户还是技术专家,都能在HiFox AI上找到适合自己的解决方案,实现“人人都能使用AI”的愿景。
|
数据可视化 搜索推荐 vr&ar
全景可视化特点+可视化功能实现
全景可视化特点+可视化功能实现
355 2
|
运维 监控 API
CloudStack 中的IP地址状态解析:Allocated、Reserved与Free
CloudStack 中的IP地址状态解析:Allocated、Reserved与Free
344 9
|
存储 安全 Linux
在Linux中,如何格式化一个磁盘分区?
在Linux中,如何格式化一个磁盘分区?
|
存储 机器人 关系型数据库
如何使用 LangChain 和 PostgreSQL + Drizzle ORM 构建上下文聊天机器人
如何使用 LangChain 和 PostgreSQL + Drizzle ORM 构建上下文聊天机器人
903 1
如何使用 LangChain 和 PostgreSQL + Drizzle ORM 构建上下文聊天机器人
|
监控 Unix Linux
12.3 Linux如何查看正在运行的进程(ps命令)
ps 命令是最常用的监控进程的命令,通过此命令可以查看系统中所有运行进程的详细信息。
2502 0
12.3 Linux如何查看正在运行的进程(ps命令)
|
Web App开发 移动开发 数据可视化
学习echarts入门
学习echarts入门
651 0