Gephi被称为“数据可视化领域的Photoshop”,是一款开源免费跨平台基于JVM的复杂网络分析软件,主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
本文参考Gephi官网的入门手册,介绍Gephi的基本使用。
Gephi版本:0.10。
数据集:LesMiserables.gexf(维克多雨果的《悲惨世界》)
1. 导入文件(Import file)
点击File-Open
打开文件LesMiserables.gexf后显示:
- Number of nodes
- Number of edges
- Type of graph
点击ok
,显示图像如下(由于节点开始时随机分布的,因此图像会略有不同)。
使用鼠标滚轮调整图形大小
使用鼠标右键调整图形位置
使用底部的滑块调整线条和箭头的粗细
使用放大镜重置位置
2. 布局(Layout)
Gephi的核心就是通过布局算法确定图形布局,默认提供12种布局,详见Gehpi的网络布局。
使用左侧面板的Layout
模块,选择Force Altas
,设置Repulsion strength
(斥力)为10000。
点击run
启动算法,点击stop
停止算法,显示图形如下:
3. 排序(Ranking)
排序是根据节点的指标和标签对其进行排序和归类,并以大小、颜色的形式应用到节点上。
选择Nodes-Ranking-Degree
点击Apply
4. 指标(Metrics)
可计算的指标包括:
- 图直径(Diameter)
- 平均路径长度(Average Path Length):网络中任意两个节点之间的距离的平均值
- 聚类系数(Clustering Coefficient):衡量节点聚集的程度
- PageRank
- HITS
- 介数中心性(Betweeness Centrality)
- 接近中心性(Closeness Centrality)
- 离心率(Eccentricity)
- 社区发现(Community Detection)
计算网络的平均路径长度(average path length):选择右侧面板的Statistics
模块,选择Avg. Path Length
,点击run
。
选择Directed
,点击OK
计算指标。
显示结果如下:
通过计算平均路径长度可得到以下三个值:
- Betweeness Centrality
- Closeness Centrality
- Eccentricity
返回Ranking
模块,在列表中选择Degree
指标,设置size
:最小尺寸10,最大尺寸50
点击apply
再次选择Layout
模块,选中Adjust by Sizes
点击run
,重新布局
5. 标签(Label)
(1)显示节点标签
(2)设置标签大小
(3)使用滑块设置标签大小
显示如下:
6. 社区发现(Community detection)
社区发现是网络分析的核心,Gephi实现了Louvain算法,该算法是一种基于模块度的社区发现算法。
选择左侧面板的Statistics
模块,选择Modularity
,点击run
。
点击ok
,显示结果如下
社区发现算法为每个节点创建了一个"Modularity Class"值,选中左侧面板的Partition
模块,选择Modularity Class
可通过Data Laboratory
查看具体指标
点击apply
为节点着色,显示如下
7. 过滤(Filter)
通过创建过滤器可隐藏网络的节点和边
选择右侧面板的Filter
模块,选择 “Topology” 分类下的“Degree Range”
将其拖拽到Queries
显示如下:
点击Degree Range
,激活Filter,并移动滑块将下界设置为2,
点击Filter
8. 预览(Preview)
选择Preview
选项卡
完成属性设置后,
点击Refresh,显示如下
可导出为SVG/PDF/PNG