备案控制台

开发者社区人工智能文章正文

论文赏析[EACL17]K-best Iterative Viterbi Parsing（K-best迭代维特比句法分析一）

2022-06-23 123

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： CKY算法或维特比inside算法是成分句法分析的主要方法之一，但是当产生式数量特别大之后，时间复杂度也线性增大。可行的一种方法是剪枝，但是剪枝会造成准确率的下降。所以本文就提出了一种迭代的维特比句法分析算法，通过剪枝去除掉没用的边。实验表明，时间上加快了一个数量级，但是本文并没有说准确率怎么样。。。本文用到的inside和outside算法之前已经介绍过了，详见PCFG中inside和outside算法详解。

介绍

CKY算法或维特比inside算法是成分句法分析的主要方法之一，但是当产生式数量特别大之后，时间复杂度也线性增大。可行的一种方法是剪枝，但是剪枝会造成准确率的下降。所以本文就提出了一种迭代的维特比句法分析算法，通过剪枝去除掉没用的边。实验表明，时间上加快了一个数量级，但是本文并没有说准确率怎么样。。。

本文用到的inside和outside算法之前已经介绍过了，详见PCFG中inside和outside算法详解。

算法框架

分层聚类

首先提出分层聚类的概念。

如上图所示，原来的类别标记有很多，将他们聚类成几个小类，再将这几个小类聚成更小的类，依次下去，最后类别标记会少很多很多。

以上图为例，，聚类之后的分析表为b图，原始的分析表为a图，聚类之后的表（下面叫粗表）b唯一对应了聚类之前的表（下面叫原始表）a，而反过来原始表a能对应多种不同的粗表b。

形式化定义

我们将类别分为层，分别表示为，那么第 m 层的类别集合就是原始的类别集合，而 0 到层的类别就称之为收缩符号。

对于，我们定义 ，其中 就是 的一个子集。该式将 中的一个类别 映射为了 中所有聚类为的类别集合。

举个例子吧，在第一张图中，。如果，那么。

那么对于，我们定义产生式 的概率为：

也就是说，粗表中的每一棵句法树都给出了它在原始表中的句法树的分数的上界，通俗说就是，如果把粗表中的收缩符号全部替换成原始表中的符号，那么新的句法树的分数一定会小于等于粗表中的句法树。

引理

如果粗表中的最优句法树不包含任意收缩符号，那么它等价于原始表中的最优句法树。

证明：

令 Y 等于原始表中的句法树集合，等于没有出现在粗表中，但是出现在原始表中的句法树集合，等于粗表中的句法树集合。

那么对于每一个句法树，都存在唯一的句法树与之对应。所以可以推出：

这就意味着也是原始表中的最优句法树。

文章标签：

数据挖掘

算法

算法码上来

目录

相关文章

星辰大海AI领航

|

6月前

|

机器学习/深度学习计算机视觉

【论文速递】CVPR2022 - 学习什么不能分割:小样本分割的新视角

【论文速递】CVPR2022 - 学习什么不能分割:小样本分割的新视角

星辰大海AI领航

98 1 1

热烈的马

|

6月前

|

自然语言处理算法索引

【Python自然语言处理】隐马尔可夫模型中维特比（Viterbi）算法解决商务选择问题实战（附源码超详细必看）

【Python自然语言处理】隐马尔可夫模型中维特比（Viterbi）算法解决商务选择问题实战（附源码超详细必看）

热烈的马

72 0 0

theMilkyWay`

|

机器学习/深度学习自然语言处理算法

机器学习面试笔试知识点-贝叶斯网络(Bayesian Network) 、马尔科夫(Markov) 和主题模型(T M)2

机器学习面试笔试知识点-贝叶斯网络(Bayesian Network) 、马尔科夫(Markov) 和主题模型(T M)

theMilkyWay`

66 0 0

-开发达人-

|

机器学习/深度学习人工智能运维

NeurIPS 2022 Oral | 基于最优子集的神经集合函数学习方法EquiVSet

NeurIPS 2022 Oral | 基于最优子集的神经集合函数学习方法EquiVSet

-开发达人-

95 0 0

-开发达人-

|

机器学习/深度学习存储人工智能

7 Papers & Radios | Hinton前向-前向神经网络训练算法；科学家造出「虫洞」登Nature封面

7 Papers & Radios | Hinton前向-前向神经网络训练算法；科学家造出「虫洞」登Nature封面

-开发达人-

126 0 0

YuetianW

|

机器学习/深度学习计算机视觉

CycleGAN 论文泛读

CycleGAN 论文泛读

YuetianW

125 0 0

算法码上来

|

算法

论文赏析[EACL17]K-best Iterative Viterbi Parsing（K-best迭代维特比句法分析二）

CKY算法或维特比inside算法是成分句法分析的主要方法之一，但是当产生式数量特别大之后，时间复杂度也线性增大。可行的一种方法是剪枝，但是剪枝会造成准确率的下降。所以本文就提出了一种迭代的维特比句法分析算法，通过剪枝去除掉没用的边。实验表明，时间上加快了一个数量级，但是本文并没有说准确率怎么样。。。本文用到的inside和outside算法之前已经介绍过了，详见PCFG中inside和outside算法详解。

算法码上来

419 0 0

论文赏析[EACL17]K-best Iterative Viterbi Parsing（K-best迭代维特比句法分析二）

算法码上来

|

机器学习/深度学习自然语言处理算法

论文赏析[EMNLP19]如何在Transformer中融入句法树信息？这里给出了一种解决方案（二）

之前其实有很多工作将句法信息融入到了RNN中，例如ON-LSTM和PRPN，用来隐式建模句法结构信息，同时提升语言模型的准确率。本文尝试将句法信息融入到Transformer中，用来赋予attention更好的解释性。同时可以无监督的预测出句子的句法树，并且相比于一般的Transformer，语言模型的性能有所提高。

算法码上来

268 0 0

论文赏析[EMNLP19]如何在Transformer中融入句法树信息？这里给出了一种解决方案（二）

算法码上来

|

机器学习/深度学习自然语言处理

论文赏析[EMNLP19]如何在Transformer中融入句法树信息？这里给出了一种解决方案（一）

之前其实有很多工作将句法信息融入到了RNN中，例如ON-LSTM和PRPN，用来隐式建模句法结构信息，同时提升语言模型的准确率。本文尝试将句法信息融入到Transformer中，用来赋予attention更好的解释性。同时可以无监督的预测出句子的句法树，并且相比于一般的Transformer，语言模型的性能有所提高。

算法码上来

182 0 0

论文赏析[EMNLP19]如何在Transformer中融入句法树信息？这里给出了一种解决方案（一）

算法码上来

论文赏析[EMNLP18]用序列标注来进行成分句法分析（二）

本文定义了一种新的树的序列化方法，将树结构预测问题转化为了序列预测问题。该序列用相邻两个结点的公共祖先（CA）数量和最近公共祖先（LCA）的label来表示一棵树，并且证明了这个树到序列的映射是单射但不是满射的，但是提出了一系列方法来解决这个问题。

算法码上来

132 0 0

论文赏析[EMNLP18]用序列标注来进行成分句法分析（二）

热门文章

最新文章

Apache Flink 进阶（三）：Checkpoint 原理解析与应用实践

weex-html5 组件进阶

阿里20亿小程序繁星计划你最需要知道的几个问题（0325更新）

Swagger-UI 介绍及基本使用指南

成长的足迹：阿里巴巴5位专家技术之路的思考与感悟

Oracle自动清理日志脚本

GEE基础学习——MODIS数据修正影像质量提升

用rem编写移动端自适应网页

挑战OOAD：游戏中物品使用时候的不同功能，用OO的方式，该如何设计？

bootstrap36-Bootstrap 下拉菜单

静态方法和实例方法的区别是什么？

静态方法和类的实例方法的执行顺序是怎样的？

在静态方法中访问类的实例属性和方法时会发生什么？

后序遍历的递归和非递归实现有何区别？

二叉树的中序遍历和后序遍历的递归与非递归代码示例

ROS进阶：使用URDF和Xacro构建差速轮式机器人模型

分享一些提高二叉树遍历算法效率的代码示例

第四届生物医学与智能系统国际学术会议（IC-BIS 2025） The 4th International Conference on Biomedical and Intelligent Systems

除了 Promise.all()，还有哪些方法可以处理异步并发操作？

如何使用 Promise 处理异步并发操作？

相关课程

更多

【算法实战】2. K近邻算法

【算法实战】5. Logistic回归算法

【算法实战】4. 朴素贝叶斯算法

【算法实战】12. 利用 Apriori 算法进行关联分析

【算法实战】8. 集成方法-Adaboost

南瓜书《机器学习公式推导》

相关电子书

更多

概率图模型

纯干货|机器学习中梯度下降法的分类及对比分析

纯干货 | 机器学习中梯度下降法的分类及对比分析

相关实验场景

更多

推荐系统入门之使用ALS算法实现打分预测

下一篇

无影云桌面