EMNLP最佳论文公布,“让发明自己语言的AI说人话”上榜

简介:
本文来自AI新媒体量子位(QbitAI)

db9a0340078844a23eb061ad4f59404883eee71b

自然语言处理领域的学术会议EMNLP今天评出了四篇最佳论文:最佳长论文两篇、最佳短论文和最佳资源论文。

EMNLP的全称是Conference on Empirical Methods in Natural Language Processing,自然语言处理中的经验方法会议,由国际语言学会(ACL)的SIGDAT小组主办,今年9月7-11日将在丹麦哥本哈根举行。

下面是本届EMNLP评出的几篇最佳XX论文。量子位决定先说最佳短论文,因为它比较好玩:

最佳短论文

Natural Language Does Not Emerge ‘Naturally’ in Multi-Agent Dialog

PDF:https://arxiv.org/pdf/1706.08502.pdf

作者:Satwik Kottur, José M.F. Moura, Stefan Lee, Dhruv Batra
(来自卡耐基梅隆大学、弗吉尼亚理工学院、乔治亚理工和Facebook AI研究院)

你可能注意到了这篇论文的最后一位作者:Facebook研究员Dhruv Batra。

前段时间被炒得沸沸扬扬的“AI发明了自己的语言”事件,最初起源于Facebook一项训练人工智能agent谈判的研究,Batra正是参与者之一,也是后来忍无可忍出来怼媒体“骗流量、不负责任”的那位。

本论文的几位作者虽然来自不同机构,但之前就在这个领域有合作,共同参与了一篇题为Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning的论文,这篇论文表明,两个AI可以通过讨论和分配颜色和形状值来发明自己的通信方式。

今天获奖的这篇,再次阐述了AI自己发明语言是非常正常的事情,但是,AI自己发明的通信方式通常都“不是人话”,论文还探索了能如何限制AI的通信规则,哄骗它们“说人话”。

几位作者在论文中以Task & Talk推理游戏为测试平台,来让两个agent沟通。

afbbb7c824d8c25867838995395109c21aefbd2a

Task & Talk游戏是这样的:有一个虚拟的世界,其中的物体有4种可能的形状、4种可能的颜色、以及4种可能的样式。负责回答问题的A-BOT拿到一个物体,然后Q-BOT的任务是通过向A-BOT提问来搞清楚物体的一对属性。

实验产生了一系列“负面”的结果之后,最终得到了一个“正面”结果。这表明,大多数agent发明的语言(对它们自己来说)都是有效的,能达到获取任务奖励等目的,但它们显然不能被人所理解。他们在论文中写道,“实际上,我们发现自然语言并不会‘自然地’出现。”

在这篇论文中,作者也讨论了如何通过在两个agent的沟通方式上增加限制条件,来“哄骗”它们,让他们发明的语言越来越接近人类,能被人所理解。

最佳长论文

1

Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints

PDF:https://arxiv.org/pdf/1707.09457.pdf

作者:Jieyu Zhao、Tianlu Wang、Mark Yatskar、Vicente Ordonez、Kai-Wei Chang
(来自弗吉尼亚大学和华盛顿大学)

这篇论文提出了一种方法,要通过语料库级的限制来减轻性别偏见在机器学习模型训练过程中的扩大。

在多标签物体识别、视觉语义角色标注等图像识别任务,都涉及到自然语言。在研究这类问题时,研究者们通常会使用结构化的预测模型和从网上搜集图片数据,这些数据也带来了一些社会偏见。

研究发现,这些任务的数据集就显示出了巨大的性别偏见,而用这些数据集训练出来的模型,会将已有的偏见放大。

98473beac5510bcf7388720ef0808019b83abc4a

比如说做饭这件事。虽然标题叫men also like shopping,但文章中最主要的例子是“cooking”。

在训练集中,做饭这个行为涉及女性的概率比男性要高33%,而用这样的数据集训练出来的模型,会放大这种偏见,在测试时,男女之间的差异被扩大到了68%。

于是,论文作者提出了用语料库级的限制来校准预测模型,并为集合推理(collective inference)设计了一种基于拉格朗日松弛的算法。使用这种方法之后,模型的识别性能几乎没有损失,但在多标签分类任务和视觉语义角色标注任务中表现出的偏见分别降低了47.5%和40.5%。

量子位想提议另一种途径,从根本上解决这个问题:男同学们多做饭,多拍照,发到网上

2

Depression and Self-Harm Risk Assessment in Online Forums

论文尚未公开

作者:Andrew Yates、Arman Cohan、Nazli Goharian
(来自马克思普朗克信息研究所和乔治城大学)

我们目前还没有看到全文,从标题来看,这篇论文是要通过线上论坛中的内容,来评估用户的抑郁和自残风险。

最佳资源论文

Crowdsourcing a Benchmark of Concept Maps

PDF:https://arxiv.org/pdf/1704.04452

作者:Tobias Falke、Iryna Gurevych
(来自德国达姆施塔特工业大学)

概念地图可以用来简洁地展示重要信息,将大型文本集合结构化。作者研究了多文档摘要的一种变体,能以概念地图的形式生成简介,但发现找不到用来评估任务效果的数据集。

于是,他们就创建了一个。

作者用众包方法创建了一个新的概念地图语料库,总结了网上教育主题的异构文件集合,同时还发布了一组基准系统,还提出了一套测试方案,用来进一步研究摘要的这种变体。

本文作者:李林
原文发布时间: 2017-08-18
相关文章
|
5月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
916 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
6月前
|
人工智能 Rust 并行计算
AI大模型开发语言排行
AI大模型开发涉及多种编程语言:Python为主流,用于算法研发;C++/CUDA优化性能;Go/Rust用于工程部署;Java适配企业系统;Julia等小众语言用于科研探索。
1876 127
|
11月前
|
人工智能 数据可视化 数据挖掘
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。
776 34
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
|
6月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
418 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
1401 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
6月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
348 10
|
6月前
|
人工智能 算法 开发者
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
552 1
|
11月前
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
1389 19
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
|
11月前
|
人工智能 自然语言处理 搜索推荐
13.5K Star!支持5国语言+全栈语音生成,这个开源AI语音项目绝了!
CosyVoice是由FunAudioLLM团队开发的多语言大语音生成模型,支持中文、英语、日语、韩语和粤语等5种语言。该项目提供从推理、训练到部署的全栈能力,具备零样本语音克隆、跨语言合成、指令控制等前沿功能。其技术架构包括底层模型、多语言支持、框架支持及部方案等,性能优越,RTF<0.2,GPU内存<4GB,QPS>20。相比同类项目,CosyVoice在语言支持、特色功能和部署难度上表现出色,支持本地部署保障数据隐私,并大幅降低商业方案成本。适用于自媒体创作、在线教育、游戏开发、智能硬件和影视制作等多种场景。
1005 0