EMNLP最佳论文公布,“让发明自己语言的AI说人话”上榜

简介:
本文来自AI新媒体量子位(QbitAI)

db9a0340078844a23eb061ad4f59404883eee71b

自然语言处理领域的学术会议EMNLP今天评出了四篇最佳论文:最佳长论文两篇、最佳短论文和最佳资源论文。

EMNLP的全称是Conference on Empirical Methods in Natural Language Processing,自然语言处理中的经验方法会议,由国际语言学会(ACL)的SIGDAT小组主办,今年9月7-11日将在丹麦哥本哈根举行。

下面是本届EMNLP评出的几篇最佳XX论文。量子位决定先说最佳短论文,因为它比较好玩:

最佳短论文

Natural Language Does Not Emerge ‘Naturally’ in Multi-Agent Dialog

PDF:https://arxiv.org/pdf/1706.08502.pdf

作者:Satwik Kottur, José M.F. Moura, Stefan Lee, Dhruv Batra
(来自卡耐基梅隆大学、弗吉尼亚理工学院、乔治亚理工和Facebook AI研究院)

你可能注意到了这篇论文的最后一位作者:Facebook研究员Dhruv Batra。

前段时间被炒得沸沸扬扬的“AI发明了自己的语言”事件,最初起源于Facebook一项训练人工智能agent谈判的研究,Batra正是参与者之一,也是后来忍无可忍出来怼媒体“骗流量、不负责任”的那位。

本论文的几位作者虽然来自不同机构,但之前就在这个领域有合作,共同参与了一篇题为Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning的论文,这篇论文表明,两个AI可以通过讨论和分配颜色和形状值来发明自己的通信方式。

今天获奖的这篇,再次阐述了AI自己发明语言是非常正常的事情,但是,AI自己发明的通信方式通常都“不是人话”,论文还探索了能如何限制AI的通信规则,哄骗它们“说人话”。

几位作者在论文中以Task & Talk推理游戏为测试平台,来让两个agent沟通。

afbbb7c824d8c25867838995395109c21aefbd2a

Task & Talk游戏是这样的:有一个虚拟的世界,其中的物体有4种可能的形状、4种可能的颜色、以及4种可能的样式。负责回答问题的A-BOT拿到一个物体,然后Q-BOT的任务是通过向A-BOT提问来搞清楚物体的一对属性。

实验产生了一系列“负面”的结果之后,最终得到了一个“正面”结果。这表明,大多数agent发明的语言(对它们自己来说)都是有效的,能达到获取任务奖励等目的,但它们显然不能被人所理解。他们在论文中写道,“实际上,我们发现自然语言并不会‘自然地’出现。”

在这篇论文中,作者也讨论了如何通过在两个agent的沟通方式上增加限制条件,来“哄骗”它们,让他们发明的语言越来越接近人类,能被人所理解。

最佳长论文

1

Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints

PDF:https://arxiv.org/pdf/1707.09457.pdf

作者:Jieyu Zhao、Tianlu Wang、Mark Yatskar、Vicente Ordonez、Kai-Wei Chang
(来自弗吉尼亚大学和华盛顿大学)

这篇论文提出了一种方法,要通过语料库级的限制来减轻性别偏见在机器学习模型训练过程中的扩大。

在多标签物体识别、视觉语义角色标注等图像识别任务,都涉及到自然语言。在研究这类问题时,研究者们通常会使用结构化的预测模型和从网上搜集图片数据,这些数据也带来了一些社会偏见。

研究发现,这些任务的数据集就显示出了巨大的性别偏见,而用这些数据集训练出来的模型,会将已有的偏见放大。

98473beac5510bcf7388720ef0808019b83abc4a

比如说做饭这件事。虽然标题叫men also like shopping,但文章中最主要的例子是“cooking”。

在训练集中,做饭这个行为涉及女性的概率比男性要高33%,而用这样的数据集训练出来的模型,会放大这种偏见,在测试时,男女之间的差异被扩大到了68%。

于是,论文作者提出了用语料库级的限制来校准预测模型,并为集合推理(collective inference)设计了一种基于拉格朗日松弛的算法。使用这种方法之后,模型的识别性能几乎没有损失,但在多标签分类任务和视觉语义角色标注任务中表现出的偏见分别降低了47.5%和40.5%。

量子位想提议另一种途径,从根本上解决这个问题:男同学们多做饭,多拍照,发到网上

2

Depression and Self-Harm Risk Assessment in Online Forums

论文尚未公开

作者:Andrew Yates、Arman Cohan、Nazli Goharian
(来自马克思普朗克信息研究所和乔治城大学)

我们目前还没有看到全文,从标题来看,这篇论文是要通过线上论坛中的内容,来评估用户的抑郁和自残风险。

最佳资源论文

Crowdsourcing a Benchmark of Concept Maps

PDF:https://arxiv.org/pdf/1704.04452

作者:Tobias Falke、Iryna Gurevych
(来自德国达姆施塔特工业大学)

概念地图可以用来简洁地展示重要信息,将大型文本集合结构化。作者研究了多文档摘要的一种变体,能以概念地图的形式生成简介,但发现找不到用来评估任务效果的数据集。

于是,他们就创建了一个。

作者用众包方法创建了一个新的概念地图语料库,总结了网上教育主题的异构文件集合,同时还发布了一组基准系统,还提出了一套测试方案,用来进一步研究摘要的这种变体。

本文作者:李林
原文发布时间: 2017-08-18
相关文章
|
1月前
|
人工智能 自然语言处理 文字识别
阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
【2月更文挑战第17天】阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
128 2
阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
|
9天前
|
人工智能 前端开发 Java
Java语言开发的AI智慧导诊系统源码springboot+redis 3D互联网智导诊系统源码
智慧导诊解决盲目就诊问题,减轻分诊工作压力。降低挂错号比例,优化就诊流程,有效提高线上线下医疗机构接诊效率。可通过人体画像选择症状部位,了解对应病症信息和推荐就医科室。
150 10
|
1月前
|
机器学习/深度学习 人工智能
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
【2月更文挑战第25天】ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
28 7
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
|
1月前
|
人工智能
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
最近,一篇发表在《Surfaces and Interfaces》的论文引起了广泛关注,因为其中意外包含了ChatGPT的提示语,暴露出学术审稿过程中的疏忽。这篇论文讨论了铜基金属-有机框架-芳香族纤维素分隔器对锂金属阳极电池的影响,但却出现了不该出现的ChatGPT对话内容。这一事件不仅令人哭笑不得,还引发了对学术审核严谨性的质疑。它反映了当前学术界可能过度依赖AI写作工具,忽略了基本的检查和编辑步骤。这一事件提醒学术界必须加强审查机制和自律,确保论文质量,防止类似尴尬情况的再次发生。
107 4
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
|
1月前
|
人工智能 自然语言处理 NoSQL
悦数图数据库推出 AI 知识图谱构建器及图语言生成助手
随着人工智能应用在全球范围的普及和风靡,大语言模型技术(Large Language Model,简称 LLM)受到了广泛的关注和应用。而图数据库作为一种处理复杂数据结构的工具,能够为企业构建行业大语言模型提供强大的支持,包括丰富亿万级别的上下文信息,提升模型的应答精度,从而实现企业级的应用效果。同时,Graph+LLM 可以助力快速构建知识图谱,帮助企业更深入地理解和挖掘数据价值。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
构建高效智能对话系统:AI在语言理解中的创新应用
【2月更文挑战第16天】 随着人工智能技术的不断进步,智能对话系统已成为日常生活和商业活动中的一个不可或缺的组成部分。本文深入探讨了如何通过自然语言处理(NLP)技术,特别是深度学习模型,来构建一个能够准确理解用户意图并提供有效响应的智能对话系统。文中将重点介绍最新的技术进展,包括注意力机制、Transformer架构以及预训练语言模型等关键技术,并讨论这些技术是如何推动智能对话系统的边界,使其更加贴近人类的交流方式。
25 1
|
1月前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
18 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
蚂蚁集团持续探索生成式AI,20篇论文入选AI顶会NeurlPS
NeurlPS官方数据显示,本届会议共有12343篇有效论文投稿,接收率为26.1%。蚂蚁集团20篇论文被收录。 据了解,蚂蚁此次入选的论文,覆盖计算机视觉、自然语言处理、图神经网络、图像处理等多个人工智能和机器学习领域的前沿主题。其中七成以上论文聚焦生成式AI在高速发展中遇到的一些挑战和难题。
蚂蚁集团持续探索生成式AI,20篇论文入选AI顶会NeurlPS
|
3月前
|
机器学习/深度学习 人工智能 算法
【论文精读】CSET - 小数据的大AI潜力
【论文精读】CSET - 小数据的大AI潜力
|
3月前
|
机器学习/深度学习 人工智能 算法
【论文精读】CSET - 小数据的大AI潜力
【论文精读】CSET - 小数据的大AI潜力
29 0