EMNLP 2019 精彩会议论文解读大全

简介: EMNLP 自然语言处理实证方法会议(Conferenceon Empirical Methods in Natural Language Processing)由ACL当中对语言数据和经验方法有特殊兴趣的团体主办,始于1996年。2019年EMNLP会议于11月3日到7日于香港亚洲世博会举办。以下是本场会议的精彩论文解读,欢迎收藏!

EMNLP 自然语言处理实证方法会议(Conferenceon Empirical Methods in Natural Language Processing)由ACL当中对语言数据和经验方法有特殊兴趣的团体主办,始于1996年。2019年EMNLP会议于11月3日到7日于香港亚洲世博会举办。以下是本场会议的精彩论文解读,欢迎收藏!

一、面向任务型对话的异构记忆网络

摘要:人类通过语言将大脑里的知识表达出来,通过对话相互传递知识。机器通过学习大量的语料可以一定程度学会流畅的语句表达,但如果没有知识,则生成的只会是漂亮而无内涵的回复。传统的模块化的对话模型可以通过数据库查询等方式将关键信息填入回答的模版中,但是端到端的对话生成模型则要更复杂一些。

为了解决这个问题,记忆网络(Memory Networks)通常是一个不错的技术方法。但是现有的记忆网络结合对话系统只是提供了如何引入知识的一个方法,并不能很好的处理多种来源和结构的知识。因此在这篇文章中,我们提出了一个异构记忆网络(Heterogeneous Memory Networks, HMNs)来同步处理用户语句,对话历史以及背景知识库。

HMNs由上下文无关(context-free memory)记忆网络和我们提出的上下文敏感(context-aware memory)记忆网络组成,分别用于编码、储存结构化的知识元组(knolwdge tuples)和序列化的用户语句、历史对话,并生成两个小词表分布(知识词表和历史对话词表)以及一个大词表(所有训练的词汇分布)供回复语句生成的选词。在三个数据集上的实验结果表明,HMNs超过了现有的SOTA模型,能够较显著的提高端到端任务型对话模型的表现。

》》查看详情 》》

二、基于归纳网络的少样本文本分类

摘要:深度学习方法在数据稀缺的场景下往往表现很差,在这种挑战性的场景下,近期的工作往往使用meta-learning的方法来模拟少样本学习任务,通过在样本级别把query和支撑集进行比较来完成分类。但是这种样本级别的比较往往会被同一个类中各种不同的表述方式所干扰,因此我们需要为支撑集中的每个类别学习一种泛化的表示,然后去和query进行度量。

在本工作中,我们提出了一个新的归纳网络(Induction Networks)来学习这样的一般化的类别表示,通过在meta learning的过程中引入动态路由算法(dynamic routing),我们的模型对于未见过的类别有良好的适应能力。我们在一个通用的英文基准数据集和一个真实场景的中文意图分类数据集上验证我们的模型,均取得了state-of-the-art的结果,证明了在少样本学习场景下学习类级别表示的有效性。

》》查看详情 》》

三、基于注意力机制优化的生成式文档摘要模型

摘要:在互联网时代,各个领域场景产生越来越多的文本数据,文本摘要作为文本“降维”处理的重要手段,旨在将文本或者文本集合转换成包含关键信息的简短摘要。该任务方法主要分为两大类:抽取式摘要和生成式摘要。抽取式摘要方法从源文档中抽取关键句或者关键词组成摘要,摘要内容全部来自原文,这种方法比较简单直接,但是做法和人类总结概括文章的方法技巧相差甚远,同时也面临coherence等问题。

随着sequence2sequence模型的出现和发展,生成式摘要模型相关研究也吸引了众多学者的目光。生成式摘要模型顾名思义,就是从源文档生成摘要,摘要中的词可能在原文中并不存在。这一大类方法更接近于人类的摘要方法,得到的摘要一般较为通顺,但是也存在诸多问题,如repetition、saliency、incorrect fact等。当然文本生成任务本身就具有较大难度,我们期待未来有一天计算机能够像人类一样会写作表达,可以写出高质量的自然语言文本。

》》查看详情 》》
相关文章
|
机器学习/深度学习 人工智能 大数据
【重磅】文娱技术喜提多篇ACM MM论文
2021ACM MM(ACM International Conference on Multimedia),阿里巴巴文娱技术共4篇论文被收录。研究成果分别是:视频修复、目标检测器、视频质量评估、情感计算 技术领域。
1087 0
【重磅】文娱技术喜提多篇ACM MM论文
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云人工智能平台PAI多篇论文入选EMNLP 2023
近期,阿里云人工智能平台PAI主导的多篇论文在EMNLP2023上入选。EMNLP是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选意味着阿里云人工智能平台PAI自研的自然语言处理算法达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
|
人工智能 自然语言处理 算法
【AI技术分享会第8期】EMNLP 2022 小样本学习论文解读来啦!开年直播好礼相送
阿里云AI技术分享会第八期《【EMNLP 2022】小样本学习论文解读》将在2023年2月8日晚18:00开启直播,精彩不容错过!
【AI技术分享会第8期】EMNLP 2022 小样本学习论文解读来啦!开年直播好礼相送
|
机器学习/深度学习 达摩院 算法
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(1)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
101 0
|
数据可视化 数据挖掘 大数据
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(2)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
185 0
|
机器学习/深度学习 自然语言处理 Oracle
Paper之ACL&EMNLP:2009年~2019年ACL计算语言学协会年会&EMNLP自然语言处理的经验方法会议历年最佳论文简介及其解读
Paper之ACL&EMNLP:2009年~2019年ACL计算语言学协会年会&EMNLP自然语言处理的经验方法会议历年最佳论文简介及其解读
Paper之ACL&EMNLP:2009年~2019年ACL计算语言学协会年会&EMNLP自然语言处理的经验方法会议历年最佳论文简介及其解读
|
人工智能 自然语言处理 前端开发
EMNLP 2021奖项公布,剑桥刘方宇、哥大杨子小帆一作论文分获最佳长、短论文奖
最佳长论文、最佳短论文的一作都是正在读博的华人学者。
266 0
EMNLP 2021奖项公布,剑桥刘方宇、哥大杨子小帆一作论文分获最佳长、短论文奖
|
机器学习/深度学习 自然语言处理 算法
TPAMI 2021 | 清华大学朱文武团队:首篇课程学习综述
来自清华大学的研究者王鑫、陈禹东、朱文武撰写了一篇名为《A Survey on Curriculum Learning》的课程学习综述论文,该论文已被TPAMI 2021收录,本文对其展开介绍。
474 0
TPAMI 2021 | 清华大学朱文武团队:首篇课程学习综述
|
机器学习/深度学习 自然语言处理 算法
|
机器学习/深度学习 人工智能 自然语言处理
AAAI 2020 阿里精选论文抢先看
人工智能领域顶会AAAI 2020刚刚在美国纽约落下帷幕。本届大会,阿里巴巴经济体共60余篇论文被大会收录,同学们以视频和海报的形式远程参与,与全世界同行分享了最新的技术进展。这里小编为你精心挑选了阿里巴巴入选的oral paper Spotlight paper 以及 最佳人工智创新应用奖获奖论文,足不出户,你也能了解阿里巴巴AI技术研究的一线干货。
2380 0