我做到了!《斗罗大陆》人物关系可视化

简介: 今天辰哥来教大家从一本小说/名著里面**提取出人名**,并对**人名之间的关系**进行统计(同一段里面人名两两出现),根据人名之间的关系进行**绘制关系图**--**gephi**

今天辰哥来教大家从一本小说/名著里面提取出人名,并对人名之间的关系进行统计(同一段里面人名两两出现),根据人名之间的关系进行绘制关系图--gephi

核心知识点

  1. 提取文本中人名
  2. 统计文本中人物之间的关系
  3. 绘制网络关系图

先看一下效果

01 jieba小例子

在开始分析《斗罗大陆》小说之前,先来一个小例子让大家对jieba库的使用有个印象。

说明:

可以看到文本内容结果jieba库分词之后,可以获取每一个的词性。咱们这里需要获取人名,只需要挑选出nr的词性,并统计每个词的次数。

这里就给大家演示讲解了jieba从文本提取人名的小例子,下面以小说《斗罗大陆》为例,讲解如何去提取里面人物名,并建立有向图,最后绘制人物关系图。

02 提取人物关系

1.制作姓名字典

部分结果如上图,通过提取小说中里面的所有名字,取出前100个并按频率从高到低写入txt。不过发现一些是不完整、无用、一个人物多名等情况。进行整理之后如下。

2.建立人物有向关系

通过构建的人物名在每一段中两两出现的进行统计。最后建立出来,人物节点和人物之间的联系。

3.保存到csv

结果如下:

03 人物关系网图

这里使用的是gephi进行绘制,gephi下载地址如下:

https://gephi.org/

下载安装之后,开始导入刚刚保存的node.csv和edge.csv数据绘制人物关系网图

1.新建工程&导入数据

新建工程->选择数据资料tab,点击输入数字表格,添加节点和边的csv数据。

2.调整相关的样式

3.修改字体,显示相应的标签

4.选择一个自动化布局的方式,预览,再调整相关参数

5. 最终点击左下角导出图片

04 小结

本文讲解了提取文本中人名并统计文本中人物之间的关系,最后绘制网络关系图,不明白的地方可以在下方留言,一起交流。

相关文章
|
7月前
|
机器学习/深度学习 搜索推荐 计算机视觉
ComicTrainee_v1.0模型——专注生成动漫风格人物画像
ComicTrainee_v1.0模型——专注生成动漫风格人物画像
77 0
|
4月前
|
机器学习/深度学习 计算机视觉
ICML 2024:人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架
【8月更文挑战第30天】在计算机视觉和机器学习领域,人物交互图像生成一直充满挑战。然而,北京大学团队在ICML 2024上提出的SA-HOI(Semantic-Aware Human Object Interaction)框架带来了新突破。该框架通过评估人物姿态质量和检测交互边界区域,结合去噪与细化技术,显著提升了生成图像的合理性与质量。广泛实验表明,SA-HOI在多样化和细粒度的人物交互类别上表现出色,为该领域提供了新的解决方案。尽管存在数据集质量和计算复杂度等局限,未来仍有很大改进空间和应用潜力。
54 3
|
6月前
|
文字识别 Linux API
视觉智能开放平台产品使用合集之图像构图美学评分的标准是什么
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
7月前
|
自然语言处理 供应链 数据可视化
R软件文本挖掘分析服装公司职位要求数据和分布地理可视化
R软件文本挖掘分析服装公司职位要求数据和分布地理可视化
|
数据可视化 数据挖掘
评论情感分析:2020年东京奥运会的微博用户数据 分析可视化 完整代码+数据 可直接运行
评论情感分析:2020年东京奥运会的微博用户数据 分析可视化 完整代码+数据 可直接运行
102 0
|
机器学习/深度学习 人工智能 自然语言处理
中文人物关系知识图谱(含码源):中文人物关系图谱构建、数据回标、基于远程监督人物关系抽取、知识问答等应用.
中文人物关系知识图谱(含码源):中文人物关系图谱构建、数据回标、基于远程监督人物关系抽取、知识问答等应用.
中文人物关系知识图谱(含码源):中文人物关系图谱构建、数据回标、基于远程监督人物关系抽取、知识问答等应用.
|
存储 分布式计算 算法
2022云栖精选—小图撬动大图:千亿规模用户群体网络的子图挖掘与应用
摘要:本文整理自阿里巴巴数据中台数据资产平台的何兴盛(河竹),在云栖大会“图计算及其应用”分论坛的分享。本篇内容主要分为四个部分: 1. 业务场景中的“大”图 2. 基于子图挖掘的设备识别解决方案 3. 离线子图采样系统Graph View 4. 总结
2022云栖精选—小图撬动大图:千亿规模用户群体网络的子图挖掘与应用
|
机器学习/深度学习 人工智能 监控
南洋理工提出全场景图生成PSG任务,像素级定位物体,还得预测56种关系
南洋理工提出全场景图生成PSG任务,像素级定位物体,还得预测56种关系
131 0
【ArcGIS制图案例】城市关系强度图
【ArcGIS制图案例】城市关系强度图
129 0
|
定位技术
无须任何数据,六十秒快速制作三维影像图用以作为城市空间格局分析的底图
无须任何数据,六十秒快速制作三维影像图用以作为城市空间格局分析的底图
124 0