论文赏析[EACL17]K-best Iterative Viterbi Parsing（K-best迭代维特比句法分析二）-阿里云开发者社区

论文赏析[EACL17]K-best Iterative Viterbi Parsing（K-best迭代维特比句法分析二）

2022-06-23 419

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： CKY算法或维特比inside算法是成分句法分析的主要方法之一，但是当产生式数量特别大之后，时间复杂度也线性增大。可行的一种方法是剪枝，但是剪枝会造成准确率的下降。所以本文就提出了一种迭代的维特比句法分析算法，通过剪枝去除掉没用的边。实验表明，时间上加快了一个数量级，但是本文并没有说准确率怎么样。。。本文用到的inside和outside算法之前已经介绍过了，详见PCFG中inside和outside算法详解。

伪代码

初始化为句法树的最优得分或者负无穷，其中det()用来求解句法树的最优得分，但是没有必要真的求出最优句法树，只需要在每个结点处保留得分最高的边即可。尽管这样得出来的句法树基本不是最高的，但是能够缩小范围即可。
init-chart()首先初始化分析表，全部初始化为收缩符号。
然后开始迭代过程，首先执行维特比inside算法，也就是CKY算法Viterbi-inside()，得到最优句法树。
如果最优句法树不含有任意收缩符号，那么迭代结束，直接返回该句法树。
否则的话，更新为最优句法树的分数best()。
expand-chart()将所有收缩符号替换为下一层的收缩符号。
Viterbi-outside()计算outside值。
prune-chart()进行剪枝，过滤掉无用的边。