备案控制台

开发者社区数据库文章正文

论文赏析[ACL18]直接到树：基于神经句法距离的成分句法分析(一）

2022-06-21 161

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 今天要讲的这篇论文发表在ACL18上面，一句话概括，本文就是将句法树序列化，通过预测序列进行句法分析。

摘要

主要思想是通过预测一个实值向量来构造出成分句法树，该实值向量表示的就是成分句法树的所有split，并且按照中序遍历给出，具体细节之后会讲到。这个方法之前没有见过，很有新意，效果也很不错，虽然比不上之前讲的基于span的方法，但是该模型最大的优点就是可以并行，时间复杂度低。

近些年来，成分句法分析模型大多是通过学习出词和短语的表示，然后用基于转移的或者基于chart的方法进行句法分析，亦或者是上一篇笔记中提到的top-down方法。但是这一类方法都有一些不可避免的缺点，比如基于转移的方法，通过预测转移序列来生成句法分析树，但是一棵句法分析树可能对应着多棵不同的转移序列，所以训练的时候可能产生错误，可以通过动态Oracle技术解决。基于chart的模型缺点就是速度太慢。

本文提出了一种新的概念叫做“syntactic distance”，以下称作句法距离，这个概念首次提出是2017年一篇语言模型的论文中的，本文将其用在了句法分析中。主要思想是这样的：对于一棵二叉树，它的中序遍历的split序列和二叉树是唯一对应的，所以只需要预测这个split序列就行了，而每个split就是用句法距离来表示。下图就是一棵句法树对应的句法距离：

这棵树有两个split，第一个split的高度更高，所以对应的句法距离数值更大。

最后通过top-down顺序进行解码，解码时间复杂度为。最后模型在PTB上取得了91.8的F1值，CTB上取得了86.5的F1值。

Syntactic Distances

一棵句法树的句法距离如下定义：

对于句法分析树 T ，它的叶子结点也就是句子为，记叶子结点的最近公共祖先LCA为，那么句法树 T 的句法距离定义为任意向量，并且满足

这个定义可能看起来比较难理解，通俗一点讲就是，中任意一对元素的大小关系和中下标相同的一对元素的大小关系是完全一样的，也就是说，句法距离大小反映的是一个句子两两相邻元素的LCA的高度大小。

还用上面那张图举个例子，，那么它的句法距离就是满足的任意向量。

这样就可以将一棵句法树唯一对应到一个句法距离的序列，只要预测这个序列就可以得到句法树了，这比预测span集合更加直接。

那么训练的时候如何将句法树转化为句法距离呢？这里只考虑二叉树，下面的算法1给出了伪代码，将句法树转化为三元组。其中 d 是两两相邻的叶子结点的LCA的高度向量，可以证明，这和中序遍历得到的结点顺序完全相同。 c 是与之顺序相同的结点的label向量。 t 是叶子结点从左向右的tag标签向量。

从算法中可以看出，采用自顶向下递归的形式，叶子结点高度为0，不存在句法距离和label。而内结点的高度等于左右儿子高度较大的一个加1，句法距离为左儿子句法距离拼接上自身句法距离再拼接上右儿子句法距离，label也是如此。

那么如果得到了一棵句法树的三元组，如何还原出这棵句法树呢？算法2给出了构造方法，其实类似于之前那篇论文的top-down方法。

原理很简单，只要在每一步寻找 d 中最大的元素，也就是寻找高度最大的内结点，该内结点对应的下标就是句法树的split，然后对左右子树递归解析就行了。时间复杂度只要，而之前的top-down模型时间复杂度为。

上图是构造句法树的一个例子，和之前一样，通过的label隐式的将句法树二叉化了，一元还是处理成新的label。图中的矩形高度就代表了句法距离的大小，可以看出，除了这两个句子开始结束标记的句法距离以外，最大，所以句法树的split就是，然后对右子树递归分析。

在子树递归过程中，可以并行计算，理论上时间复杂度可以降到，但是句子长度过短的话，是否与cpu通讯时间都要大于这个数量级了呢？这个并行的意义还有待商榷。

文章标签：

自然语言处理

并行计算

关系型数据库

Oracle

算法

算法码上来

目录

相关文章

算法码上来

|

机器学习/深度学习自然语言处理

论文赏析[ACL18]直接到树：基于神经句法距离的成分句法分析（二）

今天要讲的这篇论文发表在ACL18上面，一句话概括，本文就是将句法树序列化，通过预测序列进行句法分析。

算法码上来

124 0 0

论文赏析[ACL18]直接到树：基于神经句法距离的成分句法分析（二）

算法码上来

|

机器学习/深度学习

论文赏析[ACL18]基于RNN和动态规划的线性时间成分句法分析（二）

好像已经很久没有看论文了呢，开学了一堆事情，以后还是要抽空阅读论文，保持一定的阅读量，并且不能光看最新的论文，还得去前人传统的方法中去寻找有没有能应用于深度学习的东西，说不定就发ACL了呢（手动滑稽）。论文地址：Linear-Time Constituency Parsing with RNNs and Dynamic Programming 代码地址：github

算法码上来

105 0 0

论文赏析[ACL18]基于RNN和动态规划的线性时间成分句法分析（二）

算法码上来

|

机器学习/深度学习自然语言处理

论文赏析[ACL18]基于RNN和动态规划的线性时间成分句法分析（一）

好像已经很久没有看论文了呢，开学了一堆事情，以后还是要抽空阅读论文，保持一定的阅读量，并且不能光看最新的论文，还得去前人传统的方法中去寻找有没有能应用于深度学习的东西，说不定就发ACL了呢（手动滑稽）。论文地址：Linear-Time Constituency Parsing with RNNs and Dynamic Programming 代码地址：github

算法码上来

105 0 0

论文赏析[ACL18]基于RNN和动态规划的线性时间成分句法分析（一）

算法码上来

|

机器学习/深度学习自然语言处理

论文赏析[ACL18]一个句子向量表示究竟可以塞进多少语言性质？

本文主要探究了不同encoder在不同任务上训练得到的句子向量表示，是否蕴含了各种语言性质。

算法码上来

157 0 0

论文赏析[ACL18]一个句子向量表示究竟可以塞进多少语言性质？

算法码上来

论文赏析[EMNLP18]用序列标注来进行成分句法分析（二）

本文定义了一种新的树的序列化方法，将树结构预测问题转化为了序列预测问题。该序列用相邻两个结点的公共祖先（CA）数量和最近公共祖先（LCA）的label来表示一棵树，并且证明了这个树到序列的映射是单射但不是满射的，但是提出了一系列方法来解决这个问题。

算法码上来

138 0 0

论文赏析[EMNLP18]用序列标注来进行成分句法分析（二）

算法码上来

|

机器学习/深度学习

论文赏析[EMNLP18]用序列标注来进行成分句法分析（一）

本文定义了一种新的树的序列化方法，将树结构预测问题转化为了序列预测问题。该序列用相邻两个结点的公共祖先（CA）数量和最近公共祖先（LCA）的label来表示一棵树，并且证明了这个树到序列的映射是单射但不是满射的，但是提出了一系列方法来解决这个问题。

算法码上来

176 0 0

论文赏析[EMNLP18]用序列标注来进行成分句法分析（一）

算法码上来

|

机器学习/深度学习自然语言处理算法

论文赏析[NAACL19]基于DIORA的无监督隐式句法树归纳（二）

今天要分享的这篇论文来自NAACL2019，主要利用inside-outside算法推理出给定句子的句法树，不需要任何的监督，也不需要下游任务作为目标函数，只需要masked语言模型就行了。

算法码上来

470 0 0

论文赏析[NAACL19]基于DIORA的无监督隐式句法树归纳（二）

算法码上来

|

自然语言处理算法

论文赏析[NAACL19]基于DIORA的无监督隐式句法树归纳(一）

今天要分享的这篇论文来自NAACL2019，主要利用inside-outside算法推理出给定句子的句法树，不需要任何的监督，也不需要下游任务作为目标函数，只需要masked语言模型就行了。

算法码上来

477 0 0

论文赏析[NAACL19]基于DIORA的无监督隐式句法树归纳(一）

算法码上来

|

机器学习/深度学习自然语言处理

论文赏析[TACL18]隐式句法树模型真的能学到句子中有意义的结构吗？（二）

本文是一篇分析类论文，主要对近年来几种无监督句法分析模型（RL-SPINN和ST-Gumbel）进行了分析，得出了如下三个结论：在句子分类任务上，只有一种模型效果好于传统的树结构模型。这些模型随机性很大，初始化不同，结果也都差距很大。这些模型产生的句法树的平均深度比PTB数据集的平均深度浅。

算法码上来

538 0 0

论文赏析[TACL18]隐式句法树模型真的能学到句子中有意义的结构吗？（二）

算法码上来

|

机器学习/深度学习自然语言处理

论文赏析[TACL18]隐式句法树模型真的能学到句子中有意义的结构吗？(一）

本文是一篇分析类论文，主要对近年来几种无监督句法分析模型（RL-SPINN和ST-Gumbel）进行了分析，得出了如下三个结论：在句子分类任务上，只有一种模型效果好于传统的树结构模型。这些模型随机性很大，初始化不同，结果也都差距很大。这些模型产生的句法树的平均深度比PTB数据集的平均深度浅。

算法码上来

150 0 0

论文赏析[TACL18]隐式句法树模型真的能学到句子中有意义的结构吗？(一）

热门文章

最新文章

【实战】锐捷AC+AP配置WLAN基本服务系列

丰富、连接、待集成—MaxCompute 生态再出发

Tomcat 7.0 64位免安装解压版安装及配置

securecrt克隆会话与sshd 的 MaxSessions

安卓支持RISC-V架构的技术剖析

生成文件的另一种思路——共享文件同步

高阶自定义View --- 粒子变幻、隧道散列、组合文字

奇虎团队不到1分钟攻破谷歌Pixel 斩获12万美元奖金

npm使用指南

Visual Studio 2010快捷键大全

Smolagents：三行代码就能开发 AI 智能体，Hugging Face 开源轻量级 Agent 构建库

Cognita：小白也能搭建 RAG 系统，提供交互界面的开源模块化 RAG 框架，支持多种文档检索技术

SocraticLM：通过 AI 提问引导学生主动思考，中科大与科大讯飞联合推出苏格拉底式教育大模型

SoulChat2.0：低成本构建 AI 心理咨询师，华南理工开源心理咨询师数字孪生大语言模型

TryOffAnyone：快速将模特服装图还原为平铺商品图，生成标准化的服装展示效果

VITRON：开源像素级视觉大模型，同时满足图像与视频理解、生成、分割和编辑等视觉任务

Memory Layers：如何在不增加算力成本的情况下扩大模型的参数容量？Meta 开源解决方法

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

《量子硬件制造：降低退相干率与错误率的策略》

《量子计算硬件：关键指标对人工智能应用性能的影响》

相关课程

更多

【医学搜索Query相关性判断】赛题及baseline解读

相关电子书

更多

概率图模型

深度学习论文实现：空间变换网络-第一部分

基于神经网络的语言合成

相关实验场景

更多

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云无影云电脑免费试用，最长可试用3个月