资源 | AI领域最优论文+代码查找神器:966个ML任务、8500+论文任君挑选!

简介: 查找论文及对应源码的神器 Papers With Code 刚刚推出了最新版本,可以用图形界面查找你想要的 SOTA 实现,从应用领域到具体任务再到实现代码一步到位。

本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载
机器之心报道(晓坤、路雪)


查找论文及对应源码的神器 Papers With Code 刚刚推出了最新版本,可以用图形界面查找你想要的 SOTA 实现,从应用领域到具体任务再到实现代码一步到位。据网站开发者介绍,里面包含了 966 个机器学习任务、515 个评估排行榜(以及当前最优结果)、8625 篇论文(带源码)、704 个数据集。

网站地址:https://paperswithcode.com/sota

Papers With Code 简介

Papers With Code 由 Reddit 用户 rstoj 开发,旨在提供免费、开源的机器学习论文资源、代码和评估排行榜。目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。

该网站将 ArXiv 上的最新机器学习论文与 GitHub 上的代码(TensorFlow/PyTorch/MXNet 等)对应起来。用户可以按标题关键词查询,或者按流行程度、GitHub 收藏数排列「热门研究」。

据了解,Papers With Code 网站上的所有内容都是可编辑的,而且是版本化的。用户可以从中发现好的任务和最优结果,甚至发现一些以前不知道的研究精华。开发者还开源了整个数据集。

数据下载

论文摘要:https://paperswithcode.com/media/about/papers-with-abstracts.json.gz

论文与代码之间的链接:https://paperswithcode.com/media/about/links-between-papers-and-code.json.gz

评估排行榜:https://paperswithcode.com/media/about/evaluation-tables.json.gz

数据源

大部分数据来自于开发者的论文标注。为了确保广泛覆盖机器学习任务,开发者解析了 6 万多篇论文的标题(命名为「Method X for Task Y」)。此外,开发者还在 2018 年最后一个季度的 1600 篇 arXiv 论文摘要中手动标注了任务和数据集。

开发者还 follow 了以下项目的数据:

NLP 进展:https://github.com/sebastianruder/NLP-progress

EFF AI metrics:https://github.com/AI-metrics/AI-metrics

SQuAD:https://rajpurkar.github.io/SQuAD-explorer/

RedditSota:https://github.com/RedditSota/state-of-the-art-result-for-machine-learning-problems

抓取和导入数据的代码也已开源,详见:papers with code/sota-extractor 。

覆盖类别

Papers With Code 网站涉及广泛的机器学习任务,目前包含 966 个机器学习任务、515 个评估排行榜(以及当前最优结果)、8625 篇论文(带源码)、704 个数据集,其中光是计算机视觉就覆盖了多达 552 种任务。这些机器学习任务具体分类是:计算机视觉、自然语言处理、医疗、方法(Methodology)、语音、游戏、图、时序、音频、机器人、音乐、推理、计算机代码、知识库、对抗等。
1
2

图源:https://paperswithcode.com/sota

除此之外,我们还可以在该网站上查看「Trending Research」、「Latest Research」和「Top Papers」。每一个分类下面所列出的项目包含:论文标题、机构、发表日期、摘要、任务分类等信息。
3

使用

现在,我们来看看这个 ML SOTA 浏览器怎么用吧。

如果你进入了主页而不是上图页面,那么只要在原来的主页点击搜索框旁边的 Browse state-of-the-art,就可以看到上图的界面了。
4

以计算机视觉中的语义分割(Semantic Segmentation)任务为例。从 Browse state-of-the-art 主页视图中可以直接看到,语义分割任务中包含了 9 个排行榜以及 299 篇论文。
5

点进去之后就能看到这 9 个排行榜。不过 9 这个数字好像对不上,算了这不重要。我们可以看到 5 个数据集的 SOTA 论文,每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。例如,第一行展示了在 PASCAL VOC 2012 数据集上的当前最佳模型是 DeepLabv3+ (Xception-JFT),源论文是《Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation》。点击「See all」,就能查看排行榜的更多细节,我们点击第一行的「See all」。
6

如下图所示,点击「See all」之后,页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息,如下图所示,图中绿色点为曾经的 SOTA 论文,图中折线表示趋势图,灰色点表示性能较弱的其他论文。上图中「趋势」栏中的小图即各排行榜的 SOTA 趋势图。鼠标落在图中的点就能显示相应的模型和性能信息,点击即可直达论文详情页面(Papers With Code 页面)。
7

在趋势图下方则列出了完整的数据表格,按照评估指标从大到小排序。DeepLabv3+ (Xception-JFT) 在语义分割任务中排名第一,Mean IoU 分数为 89.0%。
8

接下来,我们点击 DeepLabv3+ (Xception-JFT) 行中的超链,就能到达该模型的 Papers With Code 页面,上面显示了论文标题、摘要、arXiv 链接,以及最重要也是 Papers with Code 最让人心水的地方——直接提供实现代码的 GitHub 链接,还不止一个。在 DeepLabv3+ (Xception-JFT) 的页面中就提供了多达 15 个实现,这些实现按照 GitHub 收藏量排序,并显示基于什么框架实现。
9
10

终于找到想要的实现了吗?请慢用......
11

代码实现列表下方还展示了这个模型在其他任务上的排行榜排名和性能。从下表可以看到,

DeepLabv3+ (Xception-JFT) 还在 Cityscapes 上实现了 82.1% 的当前最佳 Mean IoU。
12
13

到此,Papers With Code 的功能就介绍得差不多了。我们再看看其中一些让人惊喜的地方。在所有数据集的排行榜页面下方还可以看到,有非常良心的子任务分类。也就是说在语义分割页面,你还能看到和语义分割相关的其它子任务的排行榜,有实时语义分割、场景分割、弱监督分割等。点进去能查看的信息类型和上述例子一致,此处不再赘述。
14

原文转自:https://www.94477.com/article/2628972.html


阿里云数据智能产品免费体验中(5月15日-6月15日)!点击传送至活动地址!

欢迎加入阿里云数据智能交流群,欲要了解更多人工智能方面的知识,和更多同道开发者交流讨论,欢迎加入我们。

一:钉钉搜索数字进入交流群:23116044
二:钉钉扫描二维码进交流群:
test

相关文章
|
1天前
|
人工智能 前端开发 Unix
使用tree命令把自己的代码归类文件目录的方法-优雅草央千澈以优雅草AI智能功能为例给大家展示tree命令实际用法
使用tree命令把自己的代码归类文件目录的方法-优雅草央千澈以优雅草AI智能功能为例给大家展示tree命令实际用法
使用tree命令把自己的代码归类文件目录的方法-优雅草央千澈以优雅草AI智能功能为例给大家展示tree命令实际用法
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
25 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
9天前
|
人工智能 Linux API
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
PromptWizard 是微软开源的 AI 提示词自动化优化框架,通过自我演变和自我适应机制,迭代优化提示指令和上下文示例,提升大型语言模型(LLMs)在特定任务中的表现。本文详细介绍了 PromptWizard 的主要功能、技术原理以及如何运行该框架。
78 8
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
|
20天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
77 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
27天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
65 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
5天前
|
人工智能 API 数据库
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
Browser Use 是一款专为大语言模型设计的智能浏览器工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。
110 0
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
|
20天前
|
人工智能 数据挖掘
AI长脑子了?LLM惊现人类脑叶结构并有数学代码分区,MIT大牛新作震惊学界!
麻省理工学院的一项新研究揭示了大型语言模型(LLM)内部概念空间的几何结构,与人脑类似。研究通过分析稀疏自编码器生成的高维向量,发现了概念空间在原子、大脑和星系三个层次上的独特结构,为理解LLM的内部机制提供了新视角。论文地址:https://arxiv.org/abs/2410.19750
60 12
|
2月前
|
人工智能 安全 JavaScript
Open Interpreter:AI 赋能终端!在终端中对话AI模型进行编程,通过运行代码来完成各种计算机操作任务
Open Interpreter 是一个让语言模型运行代码的强大工具,提供了一个类似 ChatGPT 的界面,支持多种编程语言和丰富的功能。
99 7
Open Interpreter:AI 赋能终端!在终端中对话AI模型进行编程,通过运行代码来完成各种计算机操作任务
|
27天前
|
人工智能 文字识别 API
OpenSearch & AI搜索开放平台,实现0代码图片搜索!
本文主要介绍了如何利用阿里云的 OpenSearch 和 AI 搜索开放平台来构建一个无需编写代码就能完成的图片搜索功能。
88 12
|
21天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。