HGAT:假新闻检测的分层图注意力网络

简介: HGAT:假新闻检测的分层图注意力网络

论文标题:HGAT: Hierarchical Graph Attention Network for Fake News Detection


论文链接:https://arxiv.org/abs/2002.04397


论文来源:arXiv


一、概述


为了更有效地检测假新闻,有必要从不同的角度挖掘有意义的信息,而不是仅仅关注新闻内容。事实上,假新闻并不是以文章的形式独立存在的,网络社交媒体与新闻文章相关的新闻创作者(creators)和新闻主题(subjects)与文章共存。这些新闻创作者和新闻主题能够以一个更全面的视角描述新闻,以帮助我们能够更彻底地剔除假新闻。具体来说,对于新闻创作者,我们可以收集个人资料等补充知识。对于新闻主题,可以收集背景知识等相关信息来支持新闻检测。


新闻文章和其他相关部分可以建模为异构信息网络(heterogeneous information network,HIN)。HIN具有较强的表达丰富信息的能力,本文将假新闻检测问题描述为HIN中的节点分类问题。下图给出了一个面向新闻的异构信息网络(News-HIN)的示例:


5_5Z121~Q]58{281PY)RC}8.png

                                          News-HIN


基于HIN的假新闻检测问题的主要挑战在于以下3点:


①Hierarchy,异构网络中的表示学习是一个多层次的工作,因为节点内容的信息和模式(schema)的信息包含在不同的层次上;


②Heterogeneity,存在与新闻文章相关的各种类型的异构信息,统一学习HIN中的有效节点表示并不是一件容易的事情;


③Generalizability,为了保证所提出的模型对不同类型HIN的适用性,我们需要提出一个可扩展到各种学习设置的通用学习模型。


为了解决上述挑战,本文提出了HGAT来检测假新闻。HGAT包含两层attention机制,首先进行节点level的attention,将节点邻域内同一种类型的节点聚合成schema节点,然后进行schema-level的attention来聚合schema节点表示,最终使用学习到的表示进行假新闻检测。


二、概念


  1. 术语定义


C~[D1IH7IRE_LZKRDO7_{~M.png

  1. 问题定义


TYN(ZJ4O(6%N7U`G4M59HRP.png


三、方法


图注意力网络GAT参考链接:图注意力网络


HGAT包括node-level和scheme-level两层attention,架构图如下:


NPQ~DQ5_C73(O[1%$}HC7J4.png

                                                     HGAT


  1. Node-level attention


Node-level attention能够学习每个News Article的邻域内同一类型的节点的重要性并且聚合这些邻域节点表示成一个集成表示作为一个schema节点。Node-level attention的输入为节点的初始特征向量(文本采用TF-IDF编码)。因为News-HIN中存在多种类型的节点,因而初始节点特征向量属于不同维度的特征空间,因此需要使用对特征向量进行维度转换,这里对不同类型的节点的特征向量进行维度转换采用的是不同的转换矩阵。具体过程如下:


IG}612B7D%7(726%4EHIDNN.png

B8`U1X(W]8H4GDU2@)A@G39.png


  1. Schema-level attention


通过node-level attention,我们将News Article节点的邻域聚合为几个schema节点。从本质上讲,它相当于将来自相同类型的邻域节点的信息融合到schema节点的表示中。接下来要做的是通过schema节点的表示来学习News Article节点的表示。不同的schema节点包含类型信息,这要求我们区分节点类型的重要性。这里我们采用schema-level attention来自动学习schema node的重要性,最终使用学习到的重要性权重来融合schema节点表示。


${)F2F2GJ5Z51@59NWW]EW7.png

下图展示了两层attention的过程:


P@@POFXY51RX@~{I}UO8N9E.png

                                  两层attention


  1. 损失函数


最后就是采用一个分类器来对每个News Article节点表示8{VX7SDAZK~AW_KZW5AZR[Y.png进行分类。损失函数采用交叉熵损失函数,二分类就是用binary的交叉熵损失。


整个HGAT的算法如下:


{BHF_~873G[1VNS%_I8_F$3.png

                                          HGAT


四、实验


数据集采用PolitiFact数据集。对于新闻报道,PolitiFact在网站上提供了原始内容、事实核查结果和全面的事实核查报告。平台根据内容将它们分类为不同的主题和话题(也就是本文中的subject)。每篇文章的标注为{True, Mostly True, Half True, Mostly False, False, Pants on Fire!}之一,可以用来进行多分类以及二分类,本文进行了多分类和二分类实验。二分类时{True, Mostly True, Half True}作为一类,{Mostly False, False, Pants on Fire!}作为一类。数据集统计情况如下:


8AKXP%QTI6VHKTYRN6GY_~U.png

                                                数据集


二分类实验结果:


UO(}8S13DH0~CYUDWNCC$%K.png

                                                      二分类实验结果


多分类实验结果:


FDZ9`JSUO{~2@%)QUPXVQ8E.png

                                           多分类实验结果


对比是否去除schema-level attention的结果(去除的方式是将schema-level attention的权重设置为{`RFWXZ3J40ACX8]}1LG6Q1.png):


A3`ZA`)IF2_9R03X(9H2~6Y.png

                                                  消融实验

相关文章
|
3天前
|
数据可视化 数据挖掘
【视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享
【视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享
|
3天前
|
算法
计算机网络:封装成帧 & 透明传输 & 差错检测
计算机网络:封装成帧 & 透明传输 & 差错检测
9 0
|
3天前
|
Android开发
android检测网络连接是否存在(一)
android检测网络连接是否存在(一)
12 2
|
3天前
|
机器学习/深度学习 存储 算法
m基于Yolov2深度学习网络的螺丝检测系统matlab仿真,带GUI界面
MATLAB 2022a中展示了YOLOv2算法的螺丝检测仿真结果,该系统基于深度学习的YOLOv2网络,有效检测和定位图像中的螺丝。YOLOv2通过批标准化、高分辨率分类器等优化实现速度和精度提升。核心代码部分涉及设置训练和测试数据,调整图像大小,加载预训练模型,构建YOLOv2网络并进行训练,最终保存检测器模型。
25 3
|
3天前
|
机器学习/深度学习 人工智能 安全
【AI 初识】人工智能如何用于欺诈检测和网络安全?
【5月更文挑战第3天】【AI 初识】人工智能如何用于欺诈检测和网络安全?
|
3天前
|
机器学习/深度学习 算法 计算机视觉
m基于Yolov2深度学习网络的人体喝水行为视频检测系统matlab仿真,带GUI界面
MATLAB 2022a中使用YOLOv2算法对avi视频进行人体喝水行为检测,结果显示成功检测到目标。该算法基于全卷积网络,通过特征提取、锚框和损失函数优化实现。程序首先打乱并分割数据集,利用预训练的ResNet-50和YOLOv2网络结构进行训练,最后保存模型。
31 5
|
3天前
|
算法 数据可视化 数据挖掘
R语言社区发现算法检测心理学复杂网络:spinglass、探索性图分析walktrap算法与可视化
R语言社区发现算法检测心理学复杂网络:spinglass、探索性图分析walktrap算法与可视化
|
3天前
如何检测本地网络是否稳定
如何检测本地网络是否稳定
11 0
|
3天前
|
算法 数据可视化 数据挖掘
网络社区检测(社群发现)分析女性参加社交活动和社区节点着色可视化
网络社区检测(社群发现)分析女性参加社交活动和社区节点着色可视化
|
3天前
|
算法 数据可视化
R语言社区检测算法可视化网络图:ggplot2绘制igraph对象分析物种相对丰度
R语言社区检测算法可视化网络图:ggplot2绘制igraph对象分析物种相对丰度

热门文章

最新文章