寒假充电计划第一弹 | 打榜数据集等你来战

简介: 寒假充电计划第一弹 | 打榜数据集等你来战

常在天池冲浪,哪能没看到过打榜数据集呢~又是一年寒假时,小萌喵思前想后,觉得这样优秀的学习机会不该私藏,今天就给大家介绍介绍天池的打榜数据集,寒假一起卷死别人提升自己!

今天萌喵给大家介绍3个天池经典榜单,分别涉及多模态NLP决策智能领域的技术。这些优质榜单不仅为大家提供来自真实业务场景的宝贵数据集,还提供了学习论文和baseline代码,同学们可以打榜PK拿礼品。


MUGE

大规模中文多模态评测基准


要说当下什么研究方向最火热,萌喵认为多模态技术必属其一,毕竟多模态技术在实际业务中有非常自然的落地场景。谷歌AI大神Jeff Dean在2020年就提出多模态研究将会是未来研究的大势所趋。

当前多模态领域的数据集多以英文为主,并且缺乏一个可在不同场景、不同任务类型设置下全面评估模型性能的评测基准。在此背景下,达摩院M6团队联合浙江大学和阿里云天池平台,在中国计算机学会计算机视觉专委会(CCF-CV)的协助下,共同推出了业界首个中文多模态评测基准MUGE。

image.png

MUGE拥有当前最大规模的中文多模态评测数据集,覆盖多种类型的任务,包括图文描述基于文本的图像生成跨模态检索3个典型的多模态任务,萌喵带着大家一起瞅瞅~

1. 图文描述(Image Caption)
根据一张图像生成相应的文字描述,要求生成的描述须如实反映图中的物体以及关键细节,举例康康:

image.png

2. 基于文本的图像生成(Text to Image)
根据一段文本描述,生成符合相应描述的图像,同时要求图像清晰且逼真。举🌰:

image.png

3. 多模态检索(Multimodal Retrieval)

MUGE准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品,请注意,所有的商品图片都没有文本标题哦,因此任务更聚焦在跨模态的表征学习。我们一起看个例子:

image.png

看完任务介绍,是不是已经有大佬摩拳擦掌了?

榜单在此:https://tianchi.aliyun.com/muge

刚接触多模态研究的小伙伴也不要慌!我们也提供了Baseline供大家上手学习:https://github.com/MUGE-2021


CBLUE

中文医疗健康信息处理评测基准


疫情反反复复,影响到我们生活的诸多方面,我们期待AI技术能在医疗场景发挥价值。

CBLUE由中国中文信息学会医疗健康与生物信息处理专业委员会发起,由阿里云天池承办,并由国内诸多从事医疗AI研究的高校、企业和研究机构共同推出,是国内首个公开的中文医疗自然语言处理领域评测基准。CBLUE的目标是为了推动“医学信息学+AI”跨学科技术的发展,并助力健康中国战略。

image.png

CBLUE挑战榜覆盖了5大类医学信息处理任务,包括:医学文本信息抽取、医学术语归一化、医学文本分类、医学句子语义匹配和医疗对话理解与生成,覆盖了常见的自然语言处理任务,对模型的泛化能力提出了很高的要求。萌喵绘制了一张思维导图方便大家查询:

image.png

目前CBLUE已有接近400组选手提交打榜,是天池平台最热门的打榜数据集,感兴趣的宝子们快来挑战吧:https://tianchi.aliyun.com/cblue

我们也放出baseline代码供大家学习切磋:https://github.com/CBLUEbenchmark/CBLUE


RABBO

黑盒优化评测基准


生活中处处都有数学的影子,运筹决策技术在我们生活中扮演着重要的作用,比如物流智能调度。接下来介绍的这个数据集榜单,喵萌希望带大家一起来做场思维体操~

黑盒优化,泛指目标函数难以从数学上解析表达,缺少可直接利用的梯度信息,仅可利用目标函数输入和对应输出函数值进行最优解搜索的优化问题。这个解释是不是比较烧脑呢?别着急 ,萌喵带大家看两个有体感的例子:

image.png

1. 金属冶炼配比优化:传统制造业中存在大量原料配比优化的问题场景,我们需要通过优化生产材料的配比使产品达到质量要求的同时控制生产过程中能源消耗等成本。该类配比优化问题往往内在机理、生产流程复杂,通过进行经验性的配比实验搜索最优方案难度较大,代价极高。

2. 风场微观选址:风能作为新能源中的一种,具有安全性高、储量巨大,分布极广的优点。近年来,风力发电技术也得到了迅速发展与推广。风机微观选址问题旨在通过优化每台风力发电机组在风电场的位置,最大限度利用风能,降低风机尾流效应带来的影响,最大化风场发电量。

从以上例子中我们可以直观的感受到此类问题的目标函数很难从数学上解析表达,RABBO(Real-Aplication  Black-Box Optimization  benchmark)就是在这样的背景下产生的,包含了160多个经典的黑盒优化问题。通过提供具有实际应用背景的黑盒优化测试问题及评测方案,目标是帮助研究人员来打磨求解真实场景问题的黑盒优化算法。

image.png

RABBO榜单由达摩院决策智能实验室倾力维护,实行长期线上评测,目标是为领域内研发团队提供一个“研发工具”和“竞技平台”,打造国内外最具活力的的黑盒优化Benchmark榜单。小伙伴们快来挑战吧:https://tianchi.aliyun.com/rabbo,悄悄告诉大家,RABBO打榜优胜的选手可以获得达摩院的绿通offer噢~

看完这些数据集,你是不是也跟萌喵一样搓手手跃跃欲试了呢?快来充电打榜吧,下一匹黑马也许就是你~

老规矩!在后台回复:打榜数据集就可以一键get文本中所有的链接开始打榜了!

相关文章
|
4月前
|
缓存 监控 安全
多线程不止提速!12 个你可能从未想过的高级应用场景
本文打破“多线程=提速”的常见认知,系统梳理12种高阶应用场景:UI解耦、实时流处理、异步日志、心跳保活、预加载、并发测试、限流控制、定时调度、事件监听、密码学加速、故障隔离及Actor/CSP模型实现。强调多线程本质是提升响应性、可靠性与架构灵活性的关键设计手段。(239字)
261 3
|
移动开发 JavaScript API
HarmonyOS Next 简单上手元服务开发
本文介绍了 HarmonyOS Next 中元服务的开发流程与关键特性。元服务是一种轻量级应用程序形态,支持免安装、秒开直达,适用于听音乐、打车等场景,大幅提升服务获取效率。文章详细讲解了元服务的开发旅程,包括在 AGC 平台上新建项目、修改名称与图标、新增卡片等内容,并提供了代码示例,如 AtomicServiceTabs 的 tab 切换和标题设置、AtomicServiceNavigation 的路由管理等。此外,还探讨了 AtomicServiceWeb 的使用方法,涵盖鸿蒙页面与 h5 页面的数据传递及方法调用。
1233 20
HarmonyOS Next 简单上手元服务开发
|
11月前
|
存储 JSON 前端开发
菜鸟之路Day39一一登录
本文介绍了登录功能的实现及其相关技术细节,包括会话管理、令牌认证和异常处理等内容。作者通过 Java 实现了一个基于用户名和密码的登录接口,调用服务层和数据库层完成用户验证。同时,文章深入探讨了三种会话跟踪技术:Cookie、Session 和 JWT 令牌。 在 JWT 部分,详细讲解了其生成与校验流程,实现了登录成功后返回 JWT 令牌的功能。此外,文章还介绍了过滤器(Filter)和拦截器(Interceptor)的概念及应用,演示了如何利用它们实现登录校验。 最后,为解决前后端交互中异常响应不统一的问题,定义了一个全局异常处理器 将系统异常以统一的 JSON 格式返回给前端。
324 0
|
人工智能 算法框架/工具 C++
《C++ 人工智能模型的跨环境迁移之道:突破限制,无缝衔接》
在AI领域,C++因其高效性能和资源利用率,成为模型训练与部署的关键选择。然而,不同环境间的模型迁移面临硬件差异、软件依赖及数据兼容性等挑战。本文探讨了模型迁移的重要性、常见场景及应对策略,包括硬件适配、软件依赖管理和数据适配与验证,旨在帮助开发者和企业克服这些障碍,实现模型的高效迁移与应用。
427 11
|
人工智能 Cloud Native API
Forrester Wave:阿里云公有云产品及战略能力全球第二
阿里云被评为Forrester 公有云平台Wave评估领导者,是唯一一家入选领导者象限的中国厂商,其中阿里云在共30个打分项中有17项为最高分。
|
存储 JSON 监控
开源日志分析Logstash
【10月更文挑战第22天】
425 1
|
存储 内存技术
【RAID磁盘阵列服务器数据恢复】华为OceanStor Dorado存储系统RAID-TP数据丢失数据恢复案例
客户报告其华为OceanStor Dorado存储系统的RAID-TP出现故障,导致数据丢失。RAID-TP是一种增强型RAID级别,包含数据磁盘、校验磁盘和转换磁盘,可在两个磁盘故障时仍保护数据。通过分析RAID结构与工作原理,我们制定了恢复方案:首先从校验磁盘读取信息并计算出丢失的数据块,接着将恢复的数据写入新磁盘。由于缺乏现成工具,需定制RAID重组程序以恢复数据。华为的动态RAID重构技术保证了重构过程中冗余级别的稳定。
459 1
|
Python
Python系列(22)—— 排序函数
Python系列(22)—— 排序函数