7月最受欢迎AI研究榜单出炉，马毅最新「标准模型」排名第9-阿里云开发者社区

7月最受欢迎AI研究榜单出炉，马毅最新「标准模型」排名第9

2023-05-09 327

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

交互式建模 PAI-DSW，每月250计算时 3个月

模型训练 PAI-DLC，100CU*H 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

简介： 7月最受欢迎AI研究榜单出炉，马毅最新「标准模型」排名第9

【新智元导读】近日，有Reddit网友整理了一份七月最受欢迎的AI研究榜单，快来看看都有哪些重量级研究~

七月最受欢迎的AI研究榜单出炉啦！

这份由Reddit网友@bycloudai整理的榜单，根据推特点赞、转发和Github星数排序，列入了2022年七月排名前十的AI研究，其中包括DeepMind、Google、MIT CSAIL等知名机构。

下面一起来看看上榜的都是何方大佬~

TOP1: Formal Algorithms for Transformers

作者：Mary Phuong，Marcus Hutter

机构：DeepMind

摘要：本文旨在成为一个独立的、数学上精确的Transformer架构和算法概述。它涵盖了Transformer是什么、它们是如何训练的、它们的用途、它们的关键架构组件以及最突出的模型的预览。

Top2：Confident Adaptive Language Modeling

作者：Tal Schuster, Adam Fisch, Jai Gupta, Mostafa Dehghani, Dara Bahri, Vinh Q Tran, Yi Tay, Donald Metzler

机构：谷歌，MIT CSAIL

摘要：基于Transformer 的大型语言模型 (LLM) 的最新进展已推动许多任务的性能显著提高。然而性能提升的同时模型的大小也在急剧增加，这可能导致推理过程复杂以及成本增加。然而在实践中，大型语言模型产生的一系列迭代是由不同程度的难度组成的。

在这项工作中，我们介绍了 Confident Adaptive Language Model-ing (CALM)，这是一个动态分配不同数量的计算机输入和生成时长的框架。

早期退出解码涉及我们在这里解决的几个问题，例如：（1）使用什么置信度度量；(2) 将序列级约束与本地token的退出决策联系起来；(3) 回溯由于先前token提前退出而丢失的隐藏表示。通过对三种不同文本生成任务的理论分析和实验，我们证明了我们的框架在减少计算方面的功效——潜在加速高达3倍，同时可保持高性能。

Top3：Language Models (Mostly) Know What They Know

作者：Saurav Kadavath, Tom Conerly, Amanda Askell, Tom Henighan等

机构：Anthropic