实验结果
几种模型在PTB上的F1值如下:
可以看出对于二分类span模型,用 作为span表示效果最好,而对于rule模型,采用的是双仿射,那么用 ,也就是拼接上span左右的span效果更好。总体来说,多分类的span模型F1值是最高的。
而和其他模型的比较如下表所示:
左侧是多模型融合的结果,右侧是单模型,本文的几个模型结果都是最高的。
总结
这篇论文模型和变体有点多,其实仔细分析下来可以发现本质上也还是那么些东西,在这里简单总结一下几种模型:
首先是结构预测:
- 二分类span模型:预测每个span属于标准树的概率,测试阶段使用CKY算法解码,通过span正确的概率计算得到产生式概率。
- 多分类span模型:在二分类的基础上,预测每个span是每个label的概率,最后求和得到它属于标准树的概率,测试过程和二分类相同。
- 线性组合rule模型:通过split的得分直接预测每个产生式的概率,采用线性组合计算概率,解码采用CKY算法。
- 双仿射rule模型:除了概率计算采用双仿射,其他部分和线性组合rule模型完全相同。
然后是标签预测:
都是采用Tree-LSTM产生每个结点的编码,然后创新地使用LSTM来预测label,而不是用传统的label列表。
这篇论文可借鉴的地方还挺多的,结构和标签分开预测,span特征继续堆叠,双仿射变换等等。准备之后在以往模型上加上去试试,然后可以想想神经网络训练PCFG这类点子,其实本质上和chart-based的没啥大区别。