8 月 2 日,计算语言学、自然语言处理领域顶会第 59 届 ACL 大会及第 11 届亚洲自然语言处理学术会议 IJCNLP 联合会议(ACL-IJCNLP)以线上方式举行。
作为自然语言处理(NLP)领域的顶级学术会议,今年的 ACL 大会已是第 59 届,会议举办时间为 8 月 2 日 - 5 日。
中科院自动化所研究员宗成庆老师担任了今年的 ACL-IJCNLP 主席,程序主席包括华盛顿大学的夏飞教授(Fei Xia)和香港理工大学的李文捷(Wenjie Li)教授以及罗马大学的 Roberto Navigli。
在上周六机器之心于北京举办的 ACL 2021 论文分享会上,宗成庆老师向我们介绍了本届会议的一些数据信息。随着大会的开幕,我们可以看到更多有关今年 ACL 的论文数据,包括热门主题、中国学者的论文数据等。
从公开数据我们可以看到,今年共有 3350 篇投稿,其中包括 2327 篇长论文和 1023 篇短论文,这个数据相比去年(3429 篇)略有减少。在所有研究之中,有 710 篇最终被接收,接收率 21.2%。在今年的会议中,另有 493 篇论文被接收为 Findings,这额外 14.9% 的论文被接收到了大会的 Findings 子刊。
在论文的方向上,机器学习、翻译、信息提取、语言交互系统等方向是人们探索的主流:
值得注意的是,该会来自中国的论文投稿数量已经大幅超越美国,并领先其他国家与地区:共有 1239 篇论文投稿来自中国大陆,其中 251 篇被接收,接收率 20.3%。
最佳论文 & 杰出论文
在大会正式召开之前,程序委员会公布了全部论文奖项。本届大会的最佳论文《Vocabulary Learning via Optimal Transport for Neural Machine Translation》来自中国机构字节跳动火山翻译团队,提出了一种新的词表学习方案 VOLT,在多种翻译任务上取得了优秀的结果。
有趣的是,该研究修改前的版本曾投至另一个机器学习顶会 ICLR 2021。在 Openreview 网站上现在还能看到该论文及匿名评审的结果。当时四名评审给出的意见是 3、3、4、4——未达到接收标准,作者做了 rebuttal 之后撤稿转投 ACL 并获得了人们的认可。
从评审者的角度来看,这篇 ACL 2021 最佳论文和以往有所不同——以往经常是开创了新的方向,而今年研究的想法非常创新,且工作极为细致透彻。这是以往中国大陆学者所很少能够做到的程度。
今年的最佳主题论文(Best theme paper)研究来自卡耐基梅隆大学、巴伊兰大学、加劳德特大学与艾伦人工智能研究所等机构。第一作者殷绮妤(Kayo Yin)本科毕业于巴黎综合理工学院,目前是卡耐基梅隆大学的在读研究生。
论文链接:https://arxiv.org/abs/2105.05222
此外,还有六篇论文获得了 ACL 2021 的杰出论文荣誉,包括港中文、腾讯 AI Lab、斯坦福大学(李飞飞、曼宁等人团队)的研究。
从 ACL 的论文投稿和接收数量来看,近几年来中国的 NLP 领域从追赶者逐渐成为国际舞台的主力军。对比曾在北京举办的 ACL 2015:那时中国的论文投稿数量还不及美国,整个大会也只有 318 篇接收论文。
仍要关注到的是,国内论文投稿的接收率仍不及美国,在 NLP 的大方向上,还有很多地方值得努力。
宗成庆表示,国内论文数量的增长是人工智能领域近年来火热,以及新技术应用前景所推动的结果。随着 NLP 的发展,未来我们或许能看到更多投身这一领域的学者。