EBGCN:面向传播不确定性的谣言检测边增强贝叶斯图卷积网络

简介: EBGCN:面向传播不确定性的谣言检测边增强贝叶斯图卷积网络

论文标题:Towards Propagation Uncertainty: Edge-enhanced Bayesian Graph Convolutional Networks for Rumor Detection


论文链接:https://arxiv.org/abs/2107.11934


论文来源:ACL 2021


一、概述


现有的一些方法将谣言的传播结构构建成图,然后基于回复或转发关系来聚合邻域特征。然而,在信息传播的过程中,这些关系都被视为可信赖的边。如下图所示,一些不准确的关系(举例来说,有些回复可能与事实无关,比如一些小广告什么的)为谣言的传播结构带来了不确定性(uncertainty):


网络异常,图片无法展示
|

                                         example

对不可信赖关系的忽略将导致多层信息传播过程中的误差累积从而限制有效特征的学习。我们从两个方面论证了传播结构中这种固有的不确定性是不可避免的:

①在现实世界中,谣言的制造者总是狡猾的,他们倾向于恶意操纵他人,创建虚假的支持推文,或删除反对的声音,以逃避检测;

②对传播关系的一些标注是主观的和破碎的,可用的图将是真实传播结构的一部分,同时也包含噪声关系,从而产生不确定性。


为此本文提出了EBGCN(Edge-enhanced Bayesian Graph Convolutional Network)来处理传播结构中的不确定性。EBGCN的核心思想是根据观测图的先验信念(prior belief)自适应地控制消息传递,以替换传播图中的固定边权值。在每次迭代中,根据观察图中节点特征的先验信念,由隐关系(latent relation)的后验分布推断边的权值。然后,利用图卷积层,通过聚合重构边上的邻域信息来聚合节点特征。通过上述方式,EBGCN可以处理传播结构中的不确定性并且提高谣言检测的鲁棒性。


另外,由于训练时缺少一些关系,或者一些关系是不准确的,我们设计了一种边一致性训练框架(edge-wise consistency training framework)。该框架将对这些未标注关系的无监督一致性训练结合到对标注样本的有监督训练中,以促进更好的学习。我们进一步通过计算两种分布之间的KL散度来保证边的隐分布和节点特征在观测图中的分布的一致性。

二、问题陈述

  1. 问题陈述


QQ截图20220611213838.png


三、方法

  1. 概述

下图展示了EBGCN的大体架构:

网络异常,图片无法展示
|

                                                     框架


模型的输入为claim的文本内容和传播结构,我们首先将传播结构构建成两个相反边方向的图,分别是top-down的传播图和bottom-up的扩散图。文本内容通过文本embedding层编码成embedding向量。然后我们通过两个主要模块——节点更新模块和边推理模块来迭代地捕获丰富的结构信息,接着聚合节点特征生成图embedding,最终输出claim的预测标签。


训练时通过未标注隐关系的反向传播损失来结合贝叶斯的无监督一致性训练,也就是通过最小化无监督和有监督损失的加权累加来优化模型。


  1. EBGCN
  • 图形构造与文本embedding


QQ截图20220611214138.png


  • 节点更新(Node Update)


QQ截图20220611214434.png


  • 边推理(Edge Inference)

QQ截图20220611214541.png

  • 分类

QQ截图20220611214734.pngQQ截图20220611215749.png

QQ截图20220611220329.png

QQ截图20220611220403.png是一个权衡因子。

四、实验


  1. 数据集

数据集采用Twitter15,Twitter16和PHEME数据集,统计情况如下:


网络异常,图片无法展示
|

                                                     数据集

  1. 实验结果


对比了多个baseline方法:


网络异常,图片无法展示
|

                                        实验结果

  1. 消融实验

探究了隐关系数量QQ截图20220611220547.png和损失权衡因子QQ截图20220611220403.png的影响:

网络异常,图片无法展示
|

                                 消融实验

  1. 早期谣言检测

探究了早期谣言检测的性能:

网络异常,图片无法展示
|

早期谣言检测


  1. 例子


下图展示了一个假谣言的例子,通过边推理过程,一些无关的边的权重被缩小了:

网络异常,图片无法展示
|

                                            example



相关文章
|
存储 关系型数据库 MySQL
mysql8对gis的支持
mysql8对gis的支持
1018 0
|
安全 Linux Nacos
解决“nacos默认secret.key配置不当权限绕过漏洞“
解决“nacos默认secret.key配置不当权限绕过漏洞“
2724 0
|
XML Java 数据库连接
Spring Boot的数据访问之Spring Data JPA以及Hibernate的实战(超详细 附源码)
Spring Boot的数据访问之Spring Data JPA以及Hibernate的实战(超详细 附源码)
810 0
|
4月前
|
机器学习/深度学习 编解码 算法
对三种雷达信号调制类型的识别及MATLAB实现
对三种雷达信号调制类型的识别及MATLAB实现
|
存储 监控 搜索推荐
深度解析:装机设置全攻略,打造个性化高性能电脑
装机不仅仅是一个技术活,更是一个充满乐趣和创造性的过程。通过精心的硬件选择、兼容性的考虑、操作系统的安装与优化、个性化的设置以及性能测试与调优,你可以打造出一台符合自己使用习惯、性能出众的个性化电脑。同时,不要忽视备份与恢复策略的重要性,确保你的数据和系统安全无忧。希望本文能够为你提供有用的指导和启发,让你在装机的道路上更加得心应手。
364 1
|
机器人 Shell Python
ROS2教程05 ROS2服务
这篇文章是关于ROS2(Robot Operating System 2)服务的教程,涵盖了服务的概念、特性、命令行工具的使用,以及如何编写服务的服务器和客户端代码,并提供了测试服务通信机制的示例。
531 4
ROS2教程05 ROS2服务
|
机器学习/深度学习 人工智能 物联网
操作系统的心脏——深入理解内核机制
在本文中,我们揭开操作系统内核的神秘面纱,探索其作为计算机系统核心的重要性。通过详细分析内核的基本功能、类型以及它如何管理硬件资源和软件进程,我们将了解内核是如何成为现代计算不可或缺的基础。此外,我们还会探讨内核设计的挑战和未来趋势,为读者提供一个全面的内核知识框架。
|
负载均衡 安全 Java
微服务 Gateway 使用详解
网关(Gateway)是连接不同网络并进行数据转发的关键组件。在互联网中,路由器常作为默认网关;在现代操作系统中,网关指本地网络上转发数据包的设备。Spring Cloud Gateway是一款基于Spring Framework的API网关,具备反向代理、高性能、负载均衡、安全控制、限流熔断、日志监控等功能。通过简单配置即可实现请求路由和转发,适用于微服务架构中的集中控制、解耦客户端与服务、自动服务发现等场景,提升系统安全性与可扩展性。
1728 4
WK
|
机器学习/深度学习 人工智能 算法
那C++适合开发哪些项目
C++ 是一种功能强大、应用广泛的编程语言,适合开发多种类型的项目。它在游戏开发、操作系统、嵌入式系统、科学计算、金融、图形图像处理、数据库管理、网络通信、人工智能、虚拟现实、航空航天等领域都有广泛应用。C++ 以其高性能、内存管理和跨平台兼容性等优势,成为众多开发者的选择。
WK
727 1