R语言社区发现算法检测心理学复杂网络:spinglass、探索性图分析walktrap算法与可视化

简介: R语言社区发现算法检测心理学复杂网络:spinglass、探索性图分析walktrap算法与可视化

原文链接:http://tecdat.cn/?p=24613


我们在心理学网络论文中看到的一个问题是,作者有时会对其数据的可视化进行过度解释。这尤其涉及到图形的布局和节点的位置,例如:网络中的节点是否聚集在某些社区。

下面我将详细讨论这个问题,并提供一个关于如何识别网络中项目社群的基本R教程。非常欢迎在下面的评论部分提出反馈。


节点部署和 Fruchterman-Reingold 算法


我们创建一个例子。首先,我们拿一些数据,估计一个正则化的偏相关网络,其中节点之间的边类似于偏相关,并使用'spring'命令绘制网络。这是心理学网络文献中默认的,使用Fruchterman-Reingold算法为图中的节点创建一个布局:具有最多连接/最高连接数的节点被放在图的中心。

cort<- cor(data)
 
graph(cort,layout="spring")

matrix 是这 20 个项目的相关矩阵, Size 命令告诉我们有多少人。

这是结果图:

然而,这里的节点部署只是许多同样 "正确 "的节点部署方式中的一种。当网络中只有1-3个节点时,算法将总是以同样的方式部署它们(其中节点之间的边的长度代表它们之间的关系有多强),算法唯一的自由度是图形的旋转。但是,特别是在有许多节点的图中,部署方式只告诉我们一个非常粗略的结果,不应该被过度解释。


点击标题查阅往期内容


R语言复杂网络分析:聚类(社区检测)和可视化


01

02

03

04


以下是绘制我们上述网络的另外两种方法,它们同样 "正确"。

nNd <- 20
set.seed(1)
grh2<-grph
set.seed(2)
gr3<-grph

虽然项目之间的边显然是相同的,但节点的位置却有很大的不同。


欧洲神经精神药理学例子


《欧洲神经精神药理学》(European Neuropsychopharmacology)上Madhoo & Levine的一篇新论文为这个问题提供了一个很好的例子。他们在两个时间点(相隔12周)调查了约2500名被诊断为重度抑郁症的精神科门诊病人的14种抑郁症状的网络结构。这篇论文的一个非常不错的贡献是,他们研究了网络结构随时间的变化,其方式与我们以前在同一数据集中的研究有些不同。

与上面的网络例子类似,他们使用正则化的偏相关网络来估计两个时间点的横截面网络模型,并使用Fruchterman-Reingold算法绘制网络。他们通过目测得出结论,有4个症状群存在,而且这些症状群没有随时间变化。

"在基线时,网络由四个症状群组成(图1a),即:睡眠障碍(项目1-5),认知和物理动机缺损(项目6-9),情感(项目10-12)和食欲(项目(13-14)。

[...]终点症状分组(图1b)与基线时相似"。

但这些发现和结论仅仅是基于对结果图的视觉检查--而我们在上面已经了解到,对这些图的解释应该非常谨慎。值得注意的是,这种视觉上的过度解读在心理学网络文献中相当常见。

让人眼前一亮的另一个原因是,我们在最近的一篇论文中分析了同一数据集的社群结构,发现社群的数量随时间而变化--这与作者对图表的视觉解释相冲突。


R中的数据驱动的社群聚类


那么,如何在R中做到这一点?有许多可能性,我介绍三种:一种来自潜变量建模领域的非常成熟的方法(特征值分解);一种来自网络科学的成熟算法(spinglass算法);以及一种正在开发中的非常新的工具(使用walktrap算法的探索性图分析)。


特征值分解


传统上,我们想用潜变量框架来描述上述20个项目,问题是:我们需要多少个潜变量来解释这20个项目之间的协方差?一个非常简单的方法是查看数据中各成分的特征值。

plot(eigen)
abline(h=1)


这向我们显示了Y轴上每个成分的每个特征值;X轴显示了不同的成分。一个高的特征值意味着它能解释项目之间的大量协方差。红线描述了所谓的标准:一个简单的规则,决定我们需要多少个成分来充分描述项目之间的协方差(每个成分的特征值>1)。无论如何,根据我们现在使用的规则,我们可能会决定提取2-5个成分。我们还不知道哪个项目属于哪个成分--为此,我们需要运行,例如,探索性因子分析(EFA),看看因子载荷。

为什么这与网络有关呢?许多论文现在已经表明,潜变量模型和网络模型在数学上是等价的,这意味着在大多数情况下,支撑数据的因素的数量将转化为你在网络中可以找到的社区的数量。


Spinglass算法


第二种方法是所谓的spinglass算法,该算法在网络科学中已经非常成熟。为此,我们将上面估计的网络输入到R中。最相关的部分是最后一行membership。

spinglascmy(g)
mershp

在我们的例子中,spinglass算法检测到了5个社区,这个向量代表了这20个节点属于哪个社区(例如,节点1-7属于社区5)。然后,我们可以很容易地在qgraph中绘制这些社区,例如,对节点进行相应的着色。请注意,iqgraph是一个非常通用的软件包,除了spinglass算法之外,它还有许多其他检测社区的可能性,比如walktrap算法。(感谢Alex Millner对igraph的投入;当然,这里所有的错误都是我的错误)。

值得注意的是,spinglass算法每次运行都会导致不同的结果。这意味着你应该在运行spinglass.community之前通过set.seed()设置一个种子,而不是像我上面那样。我运行该算法1000次,看看得到的聚类数量的中位数,然后找到一个能重现这个聚类数量中位数的种子。我在一篇论文中使用了这个解决方案(注意,使用不同的种子,解决方案看起来是不同的)。

同样关键的是,要知道有许多种不同的方法来做社群检测。Spinglass有些简单化,因为它只允许项目成为一个社区的一部分--但可能项目被描述为同时属于几个社区更好。Barabási的书 "网络科学 "中有一个关于社区检测的广泛章节。Spinglass只是众多机会中的一个。正如我上面提到的:例如walktrap,也是常用的,而且更稳定。


探索性图分析


第三种方法是通过探索性图表分析。从你的数据中重新估计了一个正则化的部分相关网络,与我们上面所做的类似,然后使用walktrap算法来寻找网络中的项目社群。在使用walktrap算法的情况下,这应该会得到与igraph相同的结果(并且细节设置相同,比如步骤数)。

优点是--与特征值分解不同--它直接显示哪些项目属于哪些社群。

walktrap(da, plt= TRUE)

如果这个方法被证明是有效的,它非常容易使用,并自动显示你的项目属于哪个社区。

请注意,目前,探索性图分析采取你的数据并自动估计一个高斯图形模型(假设是多变量的正常变量)。


spinglass算法和walktrap算法结果是一样的吗?


现在,我们想检查一下我们的结果的稳健性:spinglass算法和使用walktrap算法在社区检测方面是否一致?

这很容易做到:让我们把这两个网络画在一起,并对社区进行相应的着色。首先,我们根据结果来定义社群,然后用上面第一个网络的布局来绘制网络。

walktrap(coate tile="walktap")
 
spinglass(coratix, tite="spinglass")

直觉上--基于视觉检查--walktrap的解决方案似乎更有意义,其中节点8属于蓝色社区而不是紫色社区。但是,同样,这只是复杂关系的图形显示,我们在这里必须谨慎解释。

因此,让我们用一个稍微不同的布局来绘制同一个网络。

walktrap(layou = list(int = atinomNe2,no,2)))
spinglass(cori,  layo.pr = list(iit=matrxnrm(Nd2)nde2

正如你现在看到的,在这个可视化中,不清楚节点8应该属于蓝色还是红色社区,我们没有明确的直观偏好。


结论


如果你对网络中的项目之间的统计社区感兴趣,不要只在视觉上检查你的图。当我为论文做这件事时,我使用上面描述的三种方法,通常它们的结果相当相似。显然,你也可能对理论或概念更感兴趣。在这种情况下,你可能根本不需要看你的数据,不需要经历上述所有的麻烦。

请注意,上述spinglass或walktrap等社群检测方法的最大局限是,项目确定地只属于一个社群。对于心理学数据来说,拟合因子模型经常会发现有交叉负荷的项目,这是一个问题。而你可以通过模拟一个2因子模型看到,其中1个项目在两个因子上都有同样的载荷。希望我们很快就能在R中实现允许项目同时属于多个社区的算法(Barabási在他的《网络科学》一书第9章中描述了几个。

相关文章
|
14天前
|
机器学习/深度学习 人工智能 算法
深度学习入门:理解神经网络与反向传播算法
【9月更文挑战第20天】本文将深入浅出地介绍深度学习中的基石—神经网络,以及背后的魔法—反向传播算法。我们将通过直观的例子和简单的数学公式,带你领略这一技术的魅力。无论你是编程新手,还是有一定基础的开发者,这篇文章都将为你打开深度学习的大门,让你对神经网络的工作原理有一个清晰的认识。
|
11天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
23 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
3天前
|
算法 安全
分别使用OVP-UVP和OFP-UFP算法以及AFD检测算法实现反孤岛检测simulink建模与仿真
本课题通过Simulink建模与仿真,实现OVP-UVP、OFP-UFP算法及AFD检测算法的反孤岛检测。OVP-UVP基于电压幅值变化,OFP-UFP基于频率变化,而AFD则通过注入频率偏移信号来检测孤岛效应,确保电力系统安全稳定运行。系统使用MATLAB 2013b进行建模与仿真验证。
|
3天前
|
传感器 算法 C语言
基于无线传感器网络的节点分簇算法matlab仿真
该程序对传感器网络进行分簇,考虑节点能量状态、拓扑位置及孤立节点等因素。相较于LEACH算法,本程序评估网络持续时间、节点死亡趋势及能量消耗。使用MATLAB 2022a版本运行,展示了节点能量管理优化及网络生命周期延长的效果。通过簇头管理和数据融合,实现了能量高效和网络可扩展性。
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习还不如浅层网络?RL教父Sutton持续反向传播算法登Nature
【9月更文挑战第24天】近年来,深度学习在人工智能领域取得巨大成功,但在连续学习任务中面临“损失可塑性”问题,尤其在深度强化学习中更为突出。加拿大阿尔伯塔大学的研究人员提出了一种名为“持续反向传播”的算法,通过选择性地重新初始化网络中的低效用单元,保持模型的可塑性。该算法通过评估每个连接和权重的贡献效用来决定是否重新初始化隐藏单元,并引入成熟度阈值保护新单元。实验表明,该算法能显著提升连续学习任务的表现,尤其在深度强化学习领域效果明显。然而,算法也存在计算复杂性和成熟度阈值设置等问题。
25 2
|
11天前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
31 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
5天前
|
存储 安全 网络安全
云计算与网络安全:技术融合下的信息安全新挑战
【9月更文挑战第29天】在数字化浪潮的推动下,云计算服务如雨后春笋般涌现,为各行各业提供了前所未有的便利和效率。然而,随着数据和服务的云端化,网络安全问题也日益凸显,成为制约云计算发展的关键因素之一。本文将从技术角度出发,探讨云计算环境下网络安全的重要性,分析云服务中存在的安全风险,并提出相应的防护措施。我们将通过实际案例,揭示如何在享受云计算带来的便捷的同时,确保数据的安全性和完整性。
|
2天前
|
安全 网络协议 网络安全
网络安全与信息安全:漏洞、加密与意识的三重奏
【9月更文挑战第32天】在数字世界的交响乐中,网络安全是那不可或缺的乐章。本文将带您深入探索网络安全的三大主题:网络漏洞的识别与防范、加密技术的奥秘以及安全意识的重要性。通过深入浅出的方式,我们将一起揭开这些概念的神秘面纱,并学习如何在实际生活中应用它们来保护自己的数字足迹。让我们开始这场既刺激又富有教育意义的旅程,提升个人和组织的网络安全防御能力。
|
1天前
|
存储 安全 算法
网络安全与信息安全:漏洞、加密与意识的三维防线
【9月更文挑战第33天】在数字化浪潮中,网络安全与信息安全成为守护数据宝藏的坚固盾牌。本文将深入探讨网络防御的三大支柱:安全漏洞的识别与防范,加密技术的应用和原理,以及提升个人和组织的安全意识。通过这些知识的分享,我们旨在为读者提供一套全面的网络安全策略,确保数字资产的安全无虞。
|
4天前
|
SQL 安全 程序员
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
【9月更文挑战第30天】在数字化时代,网络安全和信息安全已成为全球关注的焦点。本文将探讨网络安全漏洞、加密技术以及提升安全意识的重要性。我们将通过代码示例,深入理解网络安全的基础知识,包括常见的网络攻击手段、防御策略和加密技术的实际应用。同时,我们还将讨论如何提高个人和企业的安全意识,以应对日益复杂的网络安全威胁。
下一篇
无影云桌面