句法敏感的实体表示用于神经网络关系抽取-阿里云开发者社区

句法敏感的实体表示用于神经网络关系抽取

2019-02-20 845

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 信息抽取主要解决从海量文本中快速、准确地抽取出需求信息。关系抽取是信息抽取的关键技术之一，主要任务是从文本中识别出实体，并抽取实体间语义关系。把句法信息加入到实体的表示模型里是本文的创新之处和研究重点，下面，我们一起深入了解。

小叽导读：信息抽取主要解决从海量文本中快速、准确地抽取出需求信息。关系抽取是信息抽取的关键技术之一，主要任务是从文本中识别出实体，并抽取实体间语义关系。把句法信息加入到实体的表示模型里是本文的创新之处和研究重点，下面，我们一起深入了解。

作者：何正球，陈文亮，张梅山，李正华，张伟，张民

摘要

句法敏感的实体表示用于神经网络关系抽取。关系抽取任务大规模应用的一个主要瓶颈就是语料的获取。近年来基于神经网络的关系抽取模型把句子表示到一个低维空间。这篇论文的创新在于把句法信息加入到实体的表示模型里。首先，基于Tree-GRU，把实体上下文的依存树放入句子级别的表示。其次，利用句子间和句子内部的注意力，来获得含有目标实体的句子集合的表示。

研究背景和动机

关系抽取任务大规模应用的一个主要瓶颈就是语料的获取。远程监督模型通过将知识库应用于非结构化文本对齐来自动构建大规模训练数据，从而减轻对人工构建数据的依赖程度，并使得模型跨领域适应能力得到增强。然而，在利用远程监督构建语料的过程中，仅仅利用实体名称进行对齐，而不同实体在不同关系下应该具有更加丰富的多样的语义表示，从而导致错误标注等问题。因此，一套更加丰富的实体表示显得尤为重要。

另一方，基于语法信息的方法通常作用于两个实体之间的关系上，而语法信息是可以更加丰富实体的表示的。因此，本文基于句法上下文的实体表示来丰富实体在不同关系模式下的语义，并结合神经网络模型处理关系抽取任务。

相关工作介绍

我们把相关的工作大致分成早期基于远程监督的方法和近年来基于神经网络模型两类。

为了解决关系抽取任务严重依赖于标注语料的问题，Mintz et al.(2009)率先提出了基于远程监督的方法构建标注语料。然而，这样构建的自动标注语料含有大量的噪声。为了缓解语料中噪声带来的影响，Riedel et al.(2010)将关系抽取看成是一个多实例单类别的问题。进一步地，Hoffmannet al.(2011)和Surdeanu et al.(2012)采取了多实例多类别的策略。同时，采用最短依存路径作为关系的一个语法特征。上述方法典型的缺陷在于模型的性能依赖于特征模板的设计。

近年来，神经网络被广泛地应用于自然语言处理任务上。在关系抽取领域，Socher et al.(2012)采用循环神经网络来处理关系抽取。Zeng et al.(2014)则构建了端到端的卷积神经网络，进一步地，Zeng etal.(2015)假设多实例中至少有一个实例正确地表示了相应的关系。相比于假设有一个实例表示一对实体的关系，Linet al.(2016)通过注意力机制挑选正面的实例更充分地使用了标注语料含有的信息。

以上这些基于神经网络的方法大多数都使用词层次的表示来生成句子的向量表示。另一方面，基于语法信息的表示也受到了众多研究者的青睐，其中最主要的即最短依存路径(Miwa and Bansal(2016)和Cai et al.(2016))。

主要方法