EBGCN:面向传播不确定性的谣言检测边增强贝叶斯图卷积网络

简介: EBGCN:面向传播不确定性的谣言检测边增强贝叶斯图卷积网络

论文标题:Towards Propagation Uncertainty: Edge-enhanced Bayesian Graph Convolutional Networks for Rumor Detection


论文链接:https://arxiv.org/abs/2107.11934


论文来源:ACL 2021


一、概述


现有的一些方法将谣言的传播结构构建成图,然后基于回复或转发关系来聚合邻域特征。然而,在信息传播的过程中,这些关系都被视为可信赖的边。如下图所示,一些不准确的关系(举例来说,有些回复可能与事实无关,比如一些小广告什么的)为谣言的传播结构带来了不确定性(uncertainty):


网络异常,图片无法展示
|

                                         example

对不可信赖关系的忽略将导致多层信息传播过程中的误差累积从而限制有效特征的学习。我们从两个方面论证了传播结构中这种固有的不确定性是不可避免的:

①在现实世界中,谣言的制造者总是狡猾的,他们倾向于恶意操纵他人,创建虚假的支持推文,或删除反对的声音,以逃避检测;

②对传播关系的一些标注是主观的和破碎的,可用的图将是真实传播结构的一部分,同时也包含噪声关系,从而产生不确定性。


为此本文提出了EBGCN(Edge-enhanced Bayesian Graph Convolutional Network)来处理传播结构中的不确定性。EBGCN的核心思想是根据观测图的先验信念(prior belief)自适应地控制消息传递,以替换传播图中的固定边权值。在每次迭代中,根据观察图中节点特征的先验信念,由隐关系(latent relation)的后验分布推断边的权值。然后,利用图卷积层,通过聚合重构边上的邻域信息来聚合节点特征。通过上述方式,EBGCN可以处理传播结构中的不确定性并且提高谣言检测的鲁棒性。


另外,由于训练时缺少一些关系,或者一些关系是不准确的,我们设计了一种边一致性训练框架(edge-wise consistency training framework)。该框架将对这些未标注关系的无监督一致性训练结合到对标注样本的有监督训练中,以促进更好的学习。我们进一步通过计算两种分布之间的KL散度来保证边的隐分布和节点特征在观测图中的分布的一致性。

二、问题陈述

  1. 问题陈述


QQ截图20220611213838.png


三、方法

  1. 概述

下图展示了EBGCN的大体架构:

网络异常,图片无法展示
|

                                                     框架


模型的输入为claim的文本内容和传播结构,我们首先将传播结构构建成两个相反边方向的图,分别是top-down的传播图和bottom-up的扩散图。文本内容通过文本embedding层编码成embedding向量。然后我们通过两个主要模块——节点更新模块和边推理模块来迭代地捕获丰富的结构信息,接着聚合节点特征生成图embedding,最终输出claim的预测标签。


训练时通过未标注隐关系的反向传播损失来结合贝叶斯的无监督一致性训练,也就是通过最小化无监督和有监督损失的加权累加来优化模型。


  1. EBGCN
  • 图形构造与文本embedding


QQ截图20220611214138.png


  • 节点更新(Node Update)


QQ截图20220611214434.png


  • 边推理(Edge Inference)

QQ截图20220611214541.png

  • 分类

QQ截图20220611214734.pngQQ截图20220611215749.png

QQ截图20220611220329.png

QQ截图20220611220403.png是一个权衡因子。

四、实验


  1. 数据集

数据集采用Twitter15,Twitter16和PHEME数据集,统计情况如下:


网络异常,图片无法展示
|

                                                     数据集

  1. 实验结果


对比了多个baseline方法:


网络异常,图片无法展示
|

                                        实验结果

  1. 消融实验

探究了隐关系数量QQ截图20220611220547.png和损失权衡因子QQ截图20220611220403.png的影响:

网络异常,图片无法展示
|

                                 消融实验

  1. 早期谣言检测

探究了早期谣言检测的性能:

网络异常,图片无法展示
|

早期谣言检测


  1. 例子


下图展示了一个假谣言的例子,通过边推理过程,一些无关的边的权重被缩小了:

网络异常,图片无法展示
|

                                            example



相关文章
|
11天前
|
机器学习/深度学习 人工智能 算法
社交网络分析4(上):社交网络链路预测分析、Logistic回归模型、LLSLP方法(LightGBM 堆叠链路预测)、正则化方法、多重共线性
社交网络分析4(上):社交网络链路预测分析、Logistic回归模型、LLSLP方法(LightGBM 堆叠链路预测)、正则化方法、多重共线性
333 0
社交网络分析4(上):社交网络链路预测分析、Logistic回归模型、LLSLP方法(LightGBM 堆叠链路预测)、正则化方法、多重共线性
|
11天前
|
定位技术 计算机视觉 Windows
生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
|
11天前
|
人工智能 算法 网络架构
谷歌新论文:潜在扩散模型并非越大越好
【4月更文挑战第9天】谷歌研究团队发现,潜在扩散模型(LDMs)的性能并非完全由其大小决定。通过对比不同规模的LDMs,他们在有限推理预算下发现小模型能生成与大模型相当甚至更好的结果。研究强调了在采样效率和模型规模间的平衡,为优化生成模型在有限资源下的效能提供了新思路。然而,小模型的建模能力限制和对特定模型系列的适用性仍需进一步研究。
16 1
谷歌新论文:潜在扩散模型并非越大越好
|
9月前
|
机器学习/深度学习 编解码 索引
神经网络风格化过程的特征控制
翻译:《Controlling Perceptual Factors in Neural Style Transfer》
|
10月前
|
机器学习/深度学习 算法
基于模糊小波神经网络的空中目标威胁评估(Matlab代码实现)
基于模糊小波神经网络的空中目标威胁评估(Matlab代码实现)
|
10月前
|
资源调度
【鲁棒、状态估计】用于电力系统动态状态估计的鲁棒迭代扩展卡尔曼滤波器研究(Matlab代码实现)
【鲁棒、状态估计】用于电力系统动态状态估计的鲁棒迭代扩展卡尔曼滤波器研究(Matlab代码实现)
|
11月前
|
机器学习/深度学习 算法 计算机视觉
用于语义图像分割的弱监督和半监督学习:弱监督期望最大化方法
这篇论文只有图像级标签或边界框标签作为弱/半监督学习的输入。使用期望最大化(EM)方法,用于弱/半监督下的语义分割模型训练。
135 0
|
机器学习/深度学习 算法 计算机视觉
基于多注意力融合的抗遮挡目标跟踪算法综述
基于多注意力融合的抗遮挡目标跟踪算法综述
553 0
基于多注意力融合的抗遮挡目标跟踪算法综述
|
缓存 算法 Python
概率图推断之信念传播
变量消除算法有个致命的缺陷:每次查询都要要从头开始重新启动算法。这样会非常浪费资源,并且在计算上很麻烦。 这个问题也很容易避免。通过在第一次运行变量消除算法后缓存这些因子,我们可以轻松地计算新的边缘概率查询,基本上不需要额外的成本。 实现上面的功能有2中算法:信念传播(BP)和全联结树算法,本文先介绍信念传播算法。
139 0
概率图推断之信念传播
|
自然语言处理 PyTorch 算法框架/工具
识别形式语言能力不足,不完美的Transformer要克服自注意力的理论缺陷(2)
识别形式语言能力不足,不完美的Transformer要克服自注意力的理论缺陷