ACL最佳论文出炉,十四行诗生成、OpenNMT、概率类型学等上榜

简介:
本文来自AI新媒体量子位(QbitAI)

今天,2017年度计算语言学协会年会(ACL)评出了5篇最佳…论文,量子位整理介绍如下:

最佳演示论文:

Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight,
Hafez: an interactive poetry generation system

论文:
http://xingshi.me/data/pdf/ACL2017demo.pdf

代码:
https://github.com/shixing/poem

这篇论文描述了一个由循环神经网络(RNN)和有限状态接收器(Finite State Acceptor, FSA)构成的自动诗歌生成系统“Hafez”,可以根据任意主题生成十四行诗。用户还能通过调整风格配置,来修改、润色这些诗歌。

论文的四位作者是南加州大学武凯文(Kevin Knight)教授和他的学生Marjan Ghazvininejad、史兴、Jay Priyadarshi。

他们去年就在EMNLP上发表了一篇生成诗歌的论文:Generating Topical Poetry; Marjan Ghazvininejad,还把诗歌生成软件做成了一个Alexa Skill(https://www.amazon.com/USC-Custom-Poetry/dp/B06X9HNFGC)以及一个网页Demo(http://52.24.230.241/poem/)

最佳演示论文第二名:

Guillaume Klein、Yoon Kim、Yuntian Deng、Jean Senellart、Alexander Rush
OpenNMT: Open-Source Toolkit for Neural Machine Translation

论文:
https://arxiv.org/abs/1701.02810

项目主页:
http://opennmt.net/

代码:
https://github.com/OpenNMT/OpenNMT

这篇论文由哈佛大学和机器翻译公司SYSTRAN联合发表,他们的OpenNMT是一个开源的神经机器翻译系统。

最佳资源论文:

Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi,
A Corpus of Natural Language for Visual Reasoning

论文:
http://yoavartzi.com/pub/slya-acl.2017.pdf

项目主页:
http://lic.nlp.cornell.edu/nlvr/

数据集:
https://github.com/clic-lab/nlvr

这篇论文由康奈尔大学和Facebook AI研究院共同发表,给出了一个新的视觉推理语言数据集,其中包括92244对自然语言陈述和生成图片,以及3962个句子。

ACL 2017的程序委员会这样评价这篇论文:

我很欣赏这篇论文中的sanity check,它确保了在不理解这些数据集的情况下,无法解决相关问题。

最佳短论文:

Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia, Emmanuel Dupoux,

The Role of Prosody and Speech Register in Word Segmentation

论文:
http://aclweb.org/anthology/P17-2028

这篇论文由法国巴黎高等师范学院、法国高等社会科学院和日本理化学研究所共同完成,探索了语体和韵律在段词中的作用,结果显示,语体的作用比此前热门所认为的要小,而韵律边界信息在成人语言中比在婴儿语言中发挥着更大的作用。

众所周知,把研究结果写成短论文很难。在委员们推荐的论文中,只有这一篇符合程序委员会的“最佳短论文”标准:

(a)是作为短论文而写的,不是省略了细节的长论文;

(b)包含论文中应该包含的所有元素;

(c)作为一篇短论文,它是“最好的”。

最佳长论文:

Ryan Cotterell, Jason Eisner,

Probabilistic Typology: Deep Generative Models of Vowel Inventories

论文地址:
https://arxiv.org/abs/1705.01684

这篇论文来自康奈尔大学,将统计学方法引入类型学研究,用来解答这个经典的问题:一个自然的元音清单的如何形成的?

语言类型学研究人类语言中的各种不同结构,探索哪些结构、现象是各种语言的共性,哪些是很少出现的。元音清单就是其中的问题之一:所有语言都有元音,但并不是所有语言都包含u这个音。

程序委员会将这篇论文选为“最佳长论文”,是因为它将“古典”生成模型和神经网络结合起来,探索负责的语言学问题。

论文的第一评审这样评价它:

我对这篇文章印象深。它以微妙而恰当的方式使用了现代的深度学习工具。这篇论文为了达到前人方法未能完成的明确目标,而进行了计算。

现在,我们可以评估一个完整的元音清单出现的概率,而不再局限于根据一个元音来猜测另一个元音出现的可能性。

—— ——

本文作者:李林
原文发布时间:2017-08-03
相关文章
|
1天前
|
机器学习/深度学习 自然语言处理 算法
【ACL2023获奖论文】比你想的更弱:对弱监督学习的批判性审视
【ACL2023获奖论文】比你想的更弱:对弱监督学习的批判性审视
6 0
|
1月前
|
机器学习/深度学习 文字识别 数据挖掘
文献速读|别人家的孟德尔随机化,全基因组纯生信30分Nature子刊
Nature Genetics上的一篇高影响力(IF=30.8)文章利用孟德尔随机化分析了暴食症(BED)的遗传基础。研究通过机器学习预测个体患BED概率,进行全基因组关联研究,识别了与铁代谢相关的基因位点,如HFE、MCHR2、LRP11及APOE。这些发现揭示了BED的遗传信号与铁代谢的关联,为理解这种疾病的病理生理学提供了新见解,并为治疗研究指明方向。文章中还包括多个图表展示分析结果。读者可以通过后台回复特定代码获取文献。
29 0
|
12月前
|
机器学习/深度学习 数据采集 Web App开发
十年前,AlexNet就预定了今天的NeurIPS 2022时间检验奖
十年前,AlexNet就预定了今天的NeurIPS 2022时间检验奖
|
12月前
|
机器学习/深度学习 人工智能 编解码
7 Papers & Radios | 谷歌推出DreamBooth扩散模型;张益唐零点猜想论文出炉
7 Papers & Radios | 谷歌推出DreamBooth扩散模型;张益唐零点猜想论文出炉
169 0
|
12月前
|
机器学习/深度学习 自然语言处理 搜索推荐
7 Papers & Radios | 谷歌推出DreamBooth扩散模型;张益唐零点猜想论文出炉(2)
7 Papers & Radios | 谷歌推出DreamBooth扩散模型;张益唐零点猜想论文出炉
199 0
|
12月前
|
机器学习/深度学习 人工智能 算法
研究遭质疑,Jeff Dean回应:我们本就不是为得到新SOTA,成本计算也搞错了
研究遭质疑,Jeff Dean回应:我们本就不是为得到新SOTA,成本计算也搞错了
|
机器学习/深度学习 存储 算法
顶会最强的前20%!电影情感效应预测论文拿下ACMMM Oral收录!
顶会最强的前20%!电影情感效应预测论文拿下ACMMM Oral收录!
137 0
|
机器学习/深度学习 人工智能 自然语言处理
击穿黑盒模型!MIT华人博士发布ExSum,模型解释新神器|NAACL 2022
击穿黑盒模型!MIT华人博士发布ExSum,模型解释新神器|NAACL 2022
148 0
|
机器学习/深度学习 Web App开发 人工智能
ICLR今日放榜!创纪录2594篇投稿,687篇被接受论文华人学者参与近半
今天,ICLR 2020放榜了!共收到2594篇论文提交,创历史新高,其中,有687篇被接受,接受率为26.5%。粗略统计,大概有320篇被接受的论文中有华人学者参与,占比47%。
275 0
ICLR今日放榜!创纪录2594篇投稿,687篇被接受论文华人学者参与近半
|
机器学习/深度学习 人工智能 自然语言处理
中国接收论文量登顶,斩获最佳论文:ACL 2021统计数据出炉
2021 年的 ACL 上,国人论文的占比继续增加,最佳论文奖也被收入囊中。
172 0
中国接收论文量登顶,斩获最佳论文:ACL 2021统计数据出炉