EMNLP 2017 最佳论文揭晓,「男人也爱逛商场」获最佳长论文

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介:

雷锋网 AI 科技评论按:2017年 EMNLP 自然语言处理实证方法会议(Conference on Empirical Methods in Natural Language Processing)将于2017年9月7-11日在丹麦哥本哈根市召开。EMNLP是自然语言处理领域的顶级会议,由ACL学会下属特殊兴趣小组 SIGDAT(ACL Special Interest Group on Linguistic data and Corpus-based Approachesto NLP)组织,每年召开一次。近几年的 EMNLP 会议都吸引了来自学术界和企业界的近千人参加,论文投稿数目也有上千篇。

今年 EMNLP 共接受论文323篇,其中216篇为长论文,107篇为短论文。EMNLP 2017 也于昨日公布了最佳论文获奖论文名单,四篇论文分获两个最佳长论文奖、一个最佳短论文奖和一个最佳资源论文奖。

最佳长论文两篇

「Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints」

  • “用语料库级别的限制减少性别偏见的放大程度,其实男人也喜欢购物”

  • 论文作者:Jieyu Zhao, Tianlu Wang, Mark Yatskar, Vicente Ordonez and Kai-Wei Chang

  • 论文简介:在具有网络图像支持的富视觉识别问题定义上,语言的使用越来越多。结构化的预测模型也在这样的任务中得到使用,它们的好处是能够利用联合出现的标签和视觉输入之间的联系,随之而来的风险是把网络内容中的社会偏见也编码到了里面。在这篇论文中,作者们研究了与多标签物体识别和视觉语义角色标注相关的数据和模型,然后发现用于支持这些任务的数据集含有显著的性别偏见,用这样的数据集训练出的模型会进一步扩大已有的偏见。比如,在数据集中“做饭”这项活动有女性参加的比例比有男性参加的比例至少大33%,用这个数据集训练出的模型在测试中会把这种区别进一步扩大到68%,作者们提出了这样的方法:在模型中增加语料库级别的限制,以矫正现有的结构化预测模型的表现,并且设计了一个基于拉格朗日松弛法的算法用于各项推理。修改后的模型在文中的识别任务中几乎没有任何表现下降,但是在多标签分类和视觉语义角色标注任务中,把偏见的扩大程度相对减少了47.5%和40.5%。

  • 论文地址:https://arxiv.org/abs/1707.09457 

「Depression and Self-Harm Risk Assessment in Online Forums」

  • “在线论坛中的抑郁和自残风险评估”

  • 论文作者:Andrew Yates, Arman Cohan and Nazli Goharian

  • EMNLP暂时未公布这篇论文的更多细节

最佳短论文

「Natural Language Does Not Emerge 'Naturally' in Multi-Agent Dialog」

  • “多智能体对话中的自然语言不是真的‘自然地’产生的”

  • 论文简介:近期已经有一系列研究提出了在协作多智能体群体中做沟通协议学习的端到端方法,而且同时发现了这些智能体产生的沟通协议中出现了人类可以解释的实证语言,这些都是在无需人类监督的状况下学习到的。在这篇论文中,作者们以一项两个智能体间的任务描述推理游戏为测试环境,展示了从“负面”到“正面”的一系列结果,表明了虽然多数有智能体参与的语言是有效的(表现为取得了接近完美的任务回报),但是它们都自主选择成为了既不可解释、又不具有组合性的语言。究其根本,作者们发现自然语言并不是真的“自然地”产生的,尽管近期的文献中可以看到自然语言的产生很简单的表象。作者们探讨了如何如何引导这些新创作的语言,来让它们越来越像人类的语言、越来越具有组合性,方法就是对两个智能体可能的沟通方式中加入更多的限制。

  • 论文作者:Satwik Kottur, José Moura, Stefan Lee and Dhruv Batra. 

  • 论文地址:https://arxiv.org/abs/1706.08502 

最佳资源论文

「Bringing Structure into Summaries: Crowdsourcing a Benchmark Corpus of Concept Maps」

  • “给文档总结加上结构:众包得到的概念图语料库 benchmark”

  • 论文简介:概念图可以用来简明地表达重要信息以及给大型文档集合建立结构。所以,作者们研究了一系列概念图形式的多文档总结方式。然而,目前没有合适的数据集可以用在这项任务中。为了补上这个缺口,作者们介绍了一组新创造的概念图语料库,它对关于教育话题的各种各样的网络文档做了总结。在它的创立过程中使用了一种新的众包方法,让作者们能够高效地判定大规模文档集合中的重要元素。与这个语料库同时发布的还有一个基准系统和作者们提出的评估流程,以便未来的研究者更好地进行这一系列总结方式的研究。

  • 论文作者:Tobias Falke and Iryna Gurevych.

  • 论文地址:https://arxiv.org/abs/1704.04452 

EMNLP 2017会议期间,雷锋网 AI 科技评论也会派出记者带来全方位报道,敬请期待。同时欢迎阅读近期的更多学术会议报道。

本文作者:杨晓凡

本文转自雷锋网禁止二次转载,原文链接

相关文章
|
机器学习/深度学习 调度
详解 Diffusion (扩散) 模型
详解 Diffusion (扩散) 模型
|
算法 前端开发
钉钉文档协同编辑背后的核心技术原理
有人说,互联网给人类社会带来最深层次的变革是改变了人与人协作的方式,将信息传播的成本大幅降低。身在互联网行业之中,研究信息传播的方式方法,是我们的日常功课。
钉钉文档协同编辑背后的核心技术原理
|
人工智能 文字识别 监控
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
17737 0
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
|
10月前
|
Linux Docker 容器
Linux 中停止 Docker 服务报 warning 导致无法彻底停止问题如何解决?
在 Linux 系统中,停止 Docker 服务时遇到警告无法彻底停止的问题,可以通过系统管理工具停止服务、强制终止相关进程、检查系统资源和依赖关系、以及重置 Docker 环境来解决。通过以上步骤,能够有效地排查和解决 Docker 服务停止不彻底的问题,确保系统的稳定运行。
725 19
|
缓存 网络协议 安全
【计算巢】DNS 解析过程详解:域名如何转换为 IP 地址
【5月更文挑战第31天】DNS(域名系统)将人类可读的域名转换为IP地址,涉及本地DNS缓存、层次化DNS服务器系统,包括根DNS、顶级域名DNS和权威DNS。当查询域名时,通过DNS服务器间的交互找到对应IP并返回给浏览器。Python示例展示了DNS查询过程。尽管DNS面临安全挑战,如欺骗和缓存中毒,采取安全措施可确保其稳定性和安全性。它是互联网的重要基础,连接域名与IP,支持便捷的网络访问。
581 0
|
人工智能 缓存 安全
阿里云服务器实例规格性能参考:从五代到八代及经济型e与通用算力型u1
阿里云不断推出新一代的云服务器实例规格,以满足不同用户的多样化需求。本文将介绍阿里云服务器从五代到八代的实例规格,以及经济型e和通用算力型u1这两种热门实例规格,帮助用户更好地选择适合自己的云服务器。
阿里云服务器实例规格性能参考:从五代到八代及经济型e与通用算力型u1
|
存储 SQL 分布式计算
MaxCompute产品使用问题之如何查看项目空间耗用的存储大小
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
253 3
|
存储 Linux Windows
在Linux中,如何查看linux中内存使用率最高的进程?
在Linux中,如何查看linux中内存使用率最高的进程?
|
小程序
【微信小程序】英文字母不换行问题 flex布局字符超出宽度折行问题:设置了word-break: break-all;和flex: 1;冲突flex不生效问题
【微信小程序】英文字母不换行问题 flex布局字符超出宽度折行问题:设置了word-break: break-all;和flex: 1;冲突flex不生效问题
486 1
|
存储 数据处理 C++
内存 vs 硬盘:固态硬盘代替内存可以工作吗?
内存 vs 硬盘:固态硬盘代替内存可以工作吗?
460 2