NAACL 2022论文奖项公布:谷歌成最大赢家

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: NAACL 2022论文奖项公布:谷歌成最大赢家

共有 5 篇论文获得 NAACL 2022 论文奖项,包括最佳新任务和新资源论文、最高效 NLP 论文、最佳新任务论文、最佳新方法论文和以人为中心的 NLP 专题最佳论文。

NAACL 会议是 ACL 的的北美分会,每年举办一次,也是 NLP 领域备受关注的顶会之一。NAACL 主要涉及对话、信息抽取、信息检索、语言生成、机器翻译、多模态、统计机器学习等多个方面。

今年共有 5 篇论文获得 NAACL 论文奖项,包括最佳新任务和新资源论文、最高效 NLP 论文、最佳新任务论文、最佳新方法论文和以人为中心的 NLP 专题最佳论文,另外还有 3 篇论文获得荣誉提名。

最佳新任务和新资源论文


  • 论文:Automatic Correction of Human Translations
  • 作者:Jessy Lin、Geza Kovacs、Aditya Shastry、Joern Wuebker, John DeNero
  • 机构:UC 伯克利、 Lilt 公司
  • 论文地址:https://arxiv.org/abs/2206.08593


获奖理由:这篇论文引入了一个新的语料库,提出一种新任务——人工翻译自动更正及其解决方法。该研究表明这项任务与经过深入研究的书面错误更正和 MT 输出更正任务不同。为这项任务开发系统需要一个新的语料库,该语料库是与一家大型人工翻译服务公司密切合作精心收集的,对新开发系统的评估包括了一项深入的可用性研究。

最高效 NLP 论文


  • 论文:FNet: Mixing Tokens with Fourier Transforms
  • 作者:James Lee-Thorp、Joshua Ainslie、Ilya Eckstein、Santiago Ontanon
  • 机构:Google Research
  • 论文地址:https://arxiv.org/abs/2105.03824


获奖理由:自推出以来,Transformer 一直是语言建模多项进展的基础,部分原因在于其学习的注意力权重。然而,随着参数量的增加,Transformer 模型需要更多的算力来训练。本文用混合输入 token 的未参数化傅里叶变换替换了 transformer 架构中的自注意力层。与类似的 Transformer 模型相比,替换之后的模型在 GPU 上的训练速度提高了 80%,在 TPU 上的训练速度提高了 70%,同时在许多任务中的准确性都能和原模型媲美。这项创新还让模型能够处理更长的输入序列,让未来研究远程上下文成为可能。NAACL 委员会称赞了该团队对大型语言模型效率的贡献。

最佳新任务论文


  • 论文:FRUIT: Faithfully Reflecting Updated Information in Text
  • 作者:Robert L. Logan IV、Alexandre Tachard Passos、Sameer Singh、Ming-Wei Chang
  • 机构:加州大学欧文校区、 Google Research
  • 论文地址:https://arxiv.org/abs/2112.08634


获奖理由:该研究为 NLP 社区提供了一个有趣且相关的新挑战:在给定新证据的情况下更新知识库信息。随着时间的推移,许多静态存储的信息已经过时,需要更新。一种自动更新过时信息的方法在现实世界的应用程序中将受到极大欢迎。该研究提出了这项任务,并讨论了新任务带来的挑战,其中涉及对比文本证据以确定哪些片段已过时,以及生成新文本的语言生成。论文中发布了新创建的数据集,并公开了源代码,以允许其他人使用与该研究相同的设置重新创建新的数据集。

最佳新方法论文


  • 论文:NeuroLogic A*esque Decoding: Constrained Text Generation with Lookahead Heuristics
  • 作者:Ximing Lu、Sean Welleck、Peter West、Liwei Jiang、Jungo Kasai、Daniel Khashabi、Ronan Le Bras、Lianhui Qin、Youngjae Yu, Rowan Zellers, Noah Smith, Yejin Choi
  • 机构:艾伦人工智能研究院、华盛顿大学
  • 论文地址:https://arxiv.org/abs/2112.08726


获奖理由:语言生成最简单的形式是在高维空间中搜索问题。该论文通过将经典的 A* 搜索算法纳入语言生成过程,明确了这种联系。A* 算法允许启发式搜索,将未来性能的「前瞻」信号合并到 token 选择中。作者在许多任务中对所提模型进行了非常彻底的评估,包括问题生成、机器翻译和故事生成。与典型的波束搜索(beam search)方法以及原始的 NeuroLogic 算法相比,新模型显示出巨大的性能改进。

以人为中心 NLP 专题最佳论文


  • 论文:User-Driven Research of Medical Note Generation Software
  • 作者:Tom Knoll, Francesco Moramarco, Alex Papadopoulos Korfiatis, Rachel Young, Claudia Ruffini, Mark Perera, Christian Perstl, Ehud Reiter, Anya Belz, Aleksandar Savkov
  • 机构:Babylon 、阿伯丁大学、都柏林城市大学
  • 论文地址:https://arxiv.org/pdf/2205.02549.pdf


获奖理由:本文是 NLP 系统以用户为中心的设计的一个很好的例子。作者进行了涵盖整个软件生命周期的不同用户研究,这有助于研究团队对系统需求以及利益相关者形成更可靠的理解。而且,作者并没有停留在部署这一步,而是在系统部署了一段时间后跟踪了用户。通过每个用户研究收集的见解证明对于 NLP 系统的设计、开发和部署至关重要。这篇论文对打算部署 NLP 系统的 NLP 研究人员和从业者很有帮助。

荣誉提名奖

对以人为中心的 NLP 专题贡献荣誉提名


  • 论文:Automatic Correction of Human Translations
  • 作者:Jessy Lin, Geza Kovacs, Aditya Shastry, Joern Wuebker, John DeNero


本篇论文还获得了最佳新任务和新资源论文,如前文所介绍的。

对方法贡献荣誉提名


  • 论文:A Balanced Data Approach for Evaluating Cross-Lingual Transfer: Mapping the Linguistic Blood Bank
  • 作者:Dan Malkin, Tomasz Limisiewicz, Gabriel Stanovsky
  • 机构:希伯来大学、查理大学
  • 论文地址:https://arxiv.org/pdf/2205.04086.pdf


获奖理由:本文讨论了零样本跨语言迁移学习的一个重要但未充分探索的方面,即预训练模型的语言特征对下游微调性能的影响程度。作者提出了一个新的框架来探索这个主题,以及几个有趣的指标来描述主体(donor)和接受者(recipient)语言之间的关系。本文最具启发性的发现之一是,最常用于预训练模型的语言英语通常不是最佳选择。这一结果有可能极大地改变 NLP 研究人员处理涉及跨语言迁移学习的任务的方式。

对资源贡献荣誉提名


  • 论文:NewsEdits: A Dataset of News Article Revision Histories and a Novel Document-Level Reasoning Challenge
  • 作者:Alexander Spangher, Xiang Ren, Jonathan May, Nanyun Peng
  • 论文地址:https://openreview.net/pdf?id=EpXKbPSsYqL


获奖理由:该论文提出了一个由英语和法语报纸组成的数据集,其修订历史跨越 15 年。他们研究了文章更新在多大程度上是可预测的,并表明该任务在实践中具有相关性。先前研究主要集中在维基百科上的文章更新,其中的更改通常是小的语法更正,而该研究表明新闻文章更新主要包含语义上的新信息。除了这个新基准之外,该研究还提供了对结果的详细分析和额外的人工评估。这一新资源可以促进对自动修改文章的研究。

参考链接:https://2022.naacl.org/blog/best-papers/

相关文章
|
机器学习/深度学习 自然语言处理 安全
2022年ACM博士论文奖公布了
2022年ACM博士论文奖公布了
|
机器学习/深度学习 人工智能 自然语言处理
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
272 0
|
数据可视化 数据挖掘 大数据
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(2)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
186 0
|
机器学习/深度学习 达摩院 算法
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(1)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
106 0
|
机器学习/深度学习 人工智能 自然语言处理
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
深度生成模型可以在高分辨率下进行逼真的图像合成。但对于许多应用来说,这还不够:内容创作还需要可控。虽然最近有几项工作研究了如何分解数据中的潜在变化因素,但它们大多在二维中操作,忽略了我们的世界是三维的。
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
|
人工智能 自然语言处理 前端开发
EMNLP 2021奖项公布,剑桥刘方宇、哥大杨子小帆一作论文分获最佳长、短论文奖
最佳长论文、最佳短论文的一作都是正在读博的华人学者。
274 0
EMNLP 2021奖项公布,剑桥刘方宇、哥大杨子小帆一作论文分获最佳长、短论文奖
|
机器学习/深度学习 存储 人工智能
NeurIPS 2020奖项出炉:GPT-3等三项研究获最佳论文奖,华人一作论文获时间检验奖
一万八千人参会的NeurIPS 2020 相比去年数量暴涨了三成,在大会上,1750 亿参数模型 GPT-3 再次成为了人们热议的话题。
189 0
NeurIPS 2020奖项出炉:GPT-3等三项研究获最佳论文奖,华人一作论文获时间检验奖
|
机器学习/深度学习 vr&ar 图形学
CVPR 2020华人一作包揽最佳论文、最佳学生论文,中国作者占39%,清华高居第一
机器之心编辑部 在刚刚开幕的 CVPR 2020 上,最佳论文、最佳学生论文等奖项悉数公布,来自牛津大学的吴尚哲等人获得了最佳论文奖,本科毕业于上海交通大学、现为西蒙弗雷泽大学博士一年级学生 Zhiqin Chen 等人获得最佳学生论文。
254 0
CVPR 2020华人一作包揽最佳论文、最佳学生论文,中国作者占39%,清华高居第一
|
机器学习/深度学习 人工智能 算法
华人问鼎CVPR!最佳论文、最佳学生论文一作均为华人,近四成作者来自中国,清华为最高产机构
华人问鼎CVPR!最佳论文、最佳学生论文一作均为华人,近四成作者来自中国,清华为最高产机构
367 0
|
机器学习/深度学习 搜索推荐 算法
阿里又出排序新模型,还被国际顶会认可了 | AAAI-20 oral
DMR提供了一个Matching和Ranking联合训练的框架,U2I相关性表征的模块可以很容易嵌到现有的CTR模型中,相当于在你原来的模型上加了一些有效的特征。我们后续的CTR模型迭代会基于DMR的框架不断加入新的改进。
2991 0
阿里又出排序新模型,还被国际顶会认可了 | AAAI-20 oral