15大领域、127个任务,这里有最全的机器学习SOTA模型

简介: 机器之心又一产品「SOTA模型」今天上线啦!机器学习 SOTA 研究一网打尽。

想象一下,你是一位从事机器学习的研究者,需要持续了解最前沿研究进展;或者你希望将最前沿的机器学习研究应用于自己从事的领域。为此,当你在浩瀚无边的论文海洋中畅游时,你最需要的找到的是 SOTA 论文。


SOTA,全称「state-of-the-art」,用于描述机器学习中取得某个任务上当前最优效果的模型。例如在图像分类任务上,某个模型在常用的数据集(如 ImageNet)上取得了当前最优的性能表现,我们就可以说这个模型达到了 SOTA。


那么,怎样才能高效找到 SOTA 论文呢?遗憾的是,经过多年的发展,现在依然没有一个平台能够完整地汇总、整理、归档所有 SOTA 论文。在全世界最著名的论文预印发布平台 arXiv 上,搜索 SOTA 的结果也非常杂乱无章。此外,即使有类似于 GLEU leaderboard 之类的网站可以看到一些 SOTA 模型,但也只是机器学习庞杂体系下的一小部分。


微信图片_20211202010744.jpg

在 arXiv 上搜索 state-of-the-art 时,返回的结果会很多,但仍然不够系统。想要知道达到了 SOTA 的论文是关于什么任务、使用了什么数据,需要点进去一一查看。


机器之心作为专业的人工智能信息平台,有着多年的学术资源积累。经过对大量数据的分类与汇总,机器之心再次上线新产品:SOTA模型。你可以根据自己的需要寻找机器学习对应领域和任务下的 SOTA 论文,平台会提供论文、模型、数据集和 benchmark 的相关信息。


访问地址:www.jiqizhixin.com/sota



前沿研究触手可及


在「SOTA模型」首页,你可以直接搜索技术任务,系统会立刻返回任务定义、取得 SOTA 的模型名称、研究中最常用的模型和最热门的数据集。


如果你继续向下浏览网页,就可以看到此技术任务下所有使用过的数据集和模型,并且可以按照数据或模型的类型进行筛选。


微信图片_20211202010748.jpg


想知道历史 SOTA?完整榜单送给你


当然,这还远远不够。SOTA 是随着时间变化的,如果我们想要看到历史上取得过 SOTA 的模型和论文呢?


再往下拉页面,就可以看到历史上在该任务上取得过 SOTA 的榜单了。


你也可以点击「数据集」、「模型」或「Metrics」进行排序。


微信图片_20211202010752.jpg


如果你对某个研究感兴趣,可以展开详情,查看研究的出处论文。


微信图片_20211202010755.png

某个 SOTA 研究的详细信息。可以点击「查看详情」阅读论文


这样一来,「SOTA模型」如同一个强大的论文搜索引擎,为你直接寻找机器学习中各种各样的 SOTA 研究。它不仅仅会告诉你是什么研究,还会提供研究使用的数据集、模型、取得的 SOTA 指标数值,以及什么时候取得的 SOTA 结果。


全面系统的知识点归档


当然,你可能是一位刚刚入门机器学习的初学者,对于机器学习中的各项任务不太清楚。这时候,「SOTA模型」会是你很好的入门学习伙伴。如下图所示,「SOTA模型首页会提供各个机器学习子领域的入口。


微信图片_20211202010759.jpg


以「计算机视觉」为例,你可以点击这一子领域,「SOTA模型」会提供这一领域的定义,并提供这一领域所涉及的基础概念和技术方法。你可以根据需要选择查看。


而在这一页的下方,「SOTA模型」提供了这一领域所有涉及到的任务。如边缘检测、人脸识别等。


微信图片_20211202010802.jpg

这时候,你就可以知道是否有自己需要了解的机器学习任务了。你可以点开其中的任务查看。对于一些非常火热或成熟的研究领域,「SOTA模型」还提供了相关的活动、会议和期刊。


微信图片_20211202010807.jpg

「人脸识别」任务下,提供了相关会议和期刊的信息


海量知识库加持的模型库


能够提供如此丰富的 SOTA 论文信息,得益于机器之心背后强大的信息平台支持。在前几个月,机器之心已上线了机器之心Pro,一个为企业、学者等各方提供专业人工智能信息服务的平台。在 Pro 平台上汇聚了海量机器学习相关信息,为「SOTA模型」提供数据加持,使得「SOTA模型」能够更进一步,提供最为前沿的研究领域 SOTA 资讯和系统的机器学习知识。


目前「SOTA模型」中已涵盖 15 个机器学习领域大类,共计 127 个机器学习任务,共收录 SOTA 论文 1174 篇,归档模型 2031 个,有记录的数据集总数为 561 个。我们也将持续更新数据。


能够囊括如此之多的信息,离不开机器之心在机器学习领域的投入研究。为了提供 SOTA 论文的数据,「SOTA模型」投入了多数据源的自动化爬虫和数据清理工具,使用了机器学习和自动化工具,对特定类型的数据进行结构化处理、数据校验和去重工作。在论文数据方面,使用了论文文本数据分析和信息提取相关技术。


论文爆炸时代,更需要为读者提供精准服务


每年,机器学习领域都会有大量的投稿论文,例如 2019 年的 CVPR 大会投稿数量就超过了 5000 篇,是 2018 年投稿数的两倍。泥沙俱下的研究,增加了业内人士筛选优秀论文的成本。「SOTA 模型」产品的上线,标志着机器之心信息服务进入了新的阶段。


接下来,「SOTA 模型」将会进一步完善内容,增加更多、更为清晰和完善的数据。如果在现有的版本中没能找到自己想要的数据,稍安勿躁,我们近期也将会添加近一倍的数据。假期归来,想要了解某个技术领域或者做项目需要查找资源时,你就能用到。


同时我们也会提供更多的分析项目,并努力和机器之心现有的知识库、新闻库等模块关联。产品也会根据用户的需求提供更为精准完善的数据分类和推荐、数据对比和可视化功能。


如果您在使用「SOTA 模型」过程中,有任何反馈,可以添加微信 lyz147147 沟通交流(请备注「SOTA模型反馈」)。



www.jiqizhixin.com/sota

PC 访问,体验更佳

相关文章
|
1月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
345 109
|
2月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
月之暗面发布开源模型Kimi K2,采用MoE架构,参数达1T,激活参数32B,具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署,提供企业级方案。
188 0
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
|
6月前
|
机器学习/深度学习 人工智能 JSON
【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
阿里云的人工智能平台 PAI,作为一站式的机器学习和深度学习平台,对DistilQwen2.5-R1模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过 PAI-ModelGallery 轻松实现 Qwen2.5 系列模型的训练、评测、压缩和快速部署。本文详细介绍在 PAI 平台使用 DistilQwen2.5-R1 蒸馏模型的全链路最佳实践。
|
5月前
|
人工智能 JSON 算法
【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。
|
6月前
|
人工智能 运维 API
PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit
4月27日,阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。Step1X-Edit模型总参数量为19B,实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中,Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型,比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持Step1X-Edit一键部署方案。
|
6月前
|
人工智能 算法 网络安全
基于PAI+专属网关+私网连接:构建全链路Deepseek云上私有化部署与模型调用架构
本文介绍了阿里云通过PAI+专属网关+私网连接方案,帮助企业实现DeepSeek-R1模型的私有化部署。方案解决了算力成本高、资源紧张、部署复杂和数据安全等问题,支持全链路零公网暴露及全球低延迟算力网络,最终实现技术可控、成本优化与安全可靠的AI部署路径,满足企业全球化业务需求。
|
2月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型
阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型,提供企业级部署方案。
|
3月前
|
机器学习/深度学习 算法 安全
差分隐私机器学习:通过添加噪声让模型更安全,也更智能
本文探讨在敏感数据上应用差分隐私(DP)进行机器学习的挑战与实践。通过模拟DP-SGD算法,在模型训练中注入噪声以保护个人隐私。实验表明,该方法在保持71%准确率和0.79 AUC的同时,具备良好泛化能力,但也带来少数类预测精度下降的问题。研究强调差分隐私应作为模型设计的核心考量,而非事后补救,并提出在参数调优、扰动策略选择和隐私预算管理等方面的优化路径。
204 3
差分隐私机器学习:通过添加噪声让模型更安全,也更智能
|
3月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。