Single TPR论文解读

简介: Single TPR是2015年提出来的,是基于TPR的进一步改进,TPR论文解读可以参考Topical PageRank(TPR)论文解读_Trouble…的博客-CSDN博客。

Topical Word Importance for Fast Keyphrase Extraction


Single TPR简介


Single TPR是2015年提出来的,是基于TPR的进一步改进,TPR论文解读可以参考Topical PageRank(TPR)论文解读_Trouble…的博客-CSDN博客。Single TPR主要是对TPR需要使用LDA算法在大量语料中获取主题信息进行改进,只需计算每个文档中的单个PageRank,而不用考虑模型的主题数量。Single TPR极大地提升了速度,可以使用在存在大量主题的文本集合中,并且算法的性能不会下降很多。


Single TPR实现


对于Topical PageRank算法,其计算需要对每个主题下的字进行PageRank随机游走,最终获得每个字的排名。其计算公式如下所示:


image.png


最终结合文档的主题情况,每个字的最终得分按照下式进行计算:


image.png


作者针对每个文档需要使用K个PageRank算法迭代的方式进行改进:使用字主题向量image.png=image.png和文档主题image.png之间的余弦相似度,来确定每个字在文档中的权重,最终计算公式如下式所示。


image.png


最终将W ( w i ) 被看成w i 在文档d 中“主题字的重要性”,如果w i 是主题z k 中的重要词,那么该字对该主题的贡献度应该更大。最终的Single TPR算法计算公式应该如下式所示:


image.png


Single TPR评估


33ec1e03a8b74befafab66425a725da8.png


图1 各种关键字抽取模型的效果展示图


从上图1可以看出,作者提出的Single TPR算法在准确率和召回率上不输给TPR,但是Single TPR所需要消耗的时间将会大大减小。


Single TPR总结


Single TPR是一种无监督的关键词抽取算法,其实就是对TPR算法的改进,在减少时间的消耗情况下不降低精度。主要原理在于使用基于主题概率向量和文档主题概率之间的余弦相似度来替换在每个主题上计算每个字的重要性。也就是需要先计算每个字在每个主题上的得分和每个文档上每个主题的得分。

目录
打赏
0
0
0
0
3
分享
相关文章
【博士每天一篇文献-算法】Extending stability through hierarchical clusters in Echo State Networks
本文研究了在回声状态网络(ESN)中引入分层聚类结构对网络稳定性的影响,发现通过调整簇内和簇间的连接性及每个簇的主干单元数量,可以扩展谱半径的稳定范围,从而提高网络的稳定性和性能。
59 2
【博士每天一篇论文-算法】Collective Behavior of a Small-World Recurrent Neural System With Scale-Free Distrib
本文介绍了一种新型的尺度无标度高聚类回声状态网络(SHESN)模型,该模型通过模拟生物神经系统的特性,如小世界现象和无标度分布,显著提高了逼近复杂非线性动力学系统的能力,并在Mackey-Glass动态系统和激光时间序列预测等问题上展示了其优越的性能。
53 1
【博士每天一篇论文-算法】Collective Behavior of a Small-World Recurrent Neural System With Scale-Free Distrib
【博士每天一篇文献-实验】Exploring the Morphospace of Communication Efficiency in Complex Networks
这篇论文探讨了复杂网络中不同拓扑结构下的通信效率,并使用"效率形态空间"来分析网络拓扑与效率度量之间的关系,得出结论表明通信效率与网络结构紧密相关。
62 3
【博士每天一篇论文-综述】Echo State Network Optimization: A Systematic Literature Review
本文综述了74篇关于Echo State Network(ESN)优化的研究文章,指出生物启发方法尤其是粒子群优化(PSO)是ESN参数优化的常用技术,探讨了ESN在不同参数和拓扑结构下的行为特性,同时识别了超参数优化、评估指标和数据集选择等方面的研究空白。
50 3
【博士每天一篇文献-模型】Investigating Echo State Network Performance with Biologically-Inspired Hierarchical
本文研究了一种受果蝇生物启发的分层网络结构在回声状态网络(ESN)中的应用,通过引入层次随机块模型(HSBM)来生成具有更好结构性的网络拓扑,发现这种新拓扑结构的网络在Mackey-Glass系统预测和MNIST分类任务中表现出改善的整体解分布,从而提高了ESN的性能。
48 2
【文献学习】Channel Estimation Method Based on Transformer in High Dynamic Environment
一种基于CNN和Transformer的信道估计方法,用于在高度动态环境中跟踪信道变化特征,并通过实验结果展示了其相比传统方法的性能提升。
102 0
【论文精读】AAAI 2022 - OneRel Joint Entity and Relation Extraction with One Module in One Step
联合实体和关系提取是自然语言处理和知识图构建中的一项重要任务。现有的方法通常将联合提取任务分解为几个基本模块或处理步骤,以使其易于执行
289 0
【论文精读】COLING 2022 - CLIO: Role-interactive Multi-event Head Attention Network for DEE
将网络上的大量非结构化文本转换为结构化事件知识是NLP的一个关键但尚未解决的目标,特别是在处理文档级文本时。
92 0
SS-AGA:Multilingual Knowledge Graph Completion with Self-Supervised Adaptive Graph Alignment 论文解读
预测知识图(KG)中缺失的事实是至关重要的,因为现代知识图远未补全。由于劳动密集型的人类标签,当处理以各种语言表示的知识时,这种现象会恶化。
134 0
【论文精读】COLING 2022 - DESED: Dialogue-based Explanation for Sentence-level Event Detection
最近许多句子级事件检测的工作都集中在丰富句子语义上,例如通过多任务或基于提示的学习。尽管效果非常好,但这些方法通常依赖于标签广泛的人工标注
162 0