用Python分析《权力的游戏》

简介:
+关注继续查看

一:简介

《权力的游戏》(Game of Thrones),是美国HBO电视网制作推出的一部中世纪史诗奇幻题材的电视剧。该剧改编自美国作家乔治·R·R·马丁的奇幻小说《冰与火之歌》系列。该剧成功塑造成千上万形象饱满的人物角色、怪诞独特充满想象的风土人情,其空间之完整、细节之丰富、叙事之恣意让人感叹!现在让我们用数据分析的方式看一看这个残酷的世界!!(本文所使用的数据集来自Kaggle网站)

二:数据集介绍

该数据集包含了三个CSV文件,分别是:battles.csv,character-deaths.csv和character-predictions.csv。现分别介绍如下:

battles.csv:《权利的游戏》中所有的战争。
character-deaths.csv:人物死亡数据集。
character-predictions.csv:人物命运预测数据集。

在每一个CSV数据里面都包含了大量的变量,读懂这些变量名所代表的含义非常有必要。例如:battles.csv中的year变量代表战争发生的时间,battle_type代表战役类型,有伏击战,围攻战,突袭战等。

三:导入所需模块并加载数据集

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

设置绘图风格(本人电脑不能在图中添加中文字符):

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

导入数据集:

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

四:数据探索性分析

哪个区域拥有最多的战争

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

战争类型的比较

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

可以看出对阵战最多,攻城战次之

哪位国王好战呢?!!

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

哪位国王被攻击最多呢?!

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

主要人物的死亡与被俘事件/根据年分组

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

军队实力对于战争结果的影响

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

蓝色代表进攻方失败,图中右下角以少胜多,不知道这场战役是怎么打的??

不同国王的军队里面有多少指挥官,红色线代表均值,五角星代表异常值

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

相关性可视化

主要可视化的是character-deaths.csv数据集和character-predictions.csv数据集。

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

去除非数值的行:

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

可视化:

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=
640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

从相关性图中可以看到一些符合“感觉”的关系,比如《权利的游戏》与《冰与火之歌》第一册的相关系数达0.86。


原文发布时间为:2017-09-03

本文作者:挖掘机小王子

本文来自云栖社区合作伙伴“Python中文社区”,了解相关信息可以关注“Python中文社区”微信公众号

相关文章
|
3天前
|
机器学习/深度学习 搜索推荐 数据挖掘
Python实战项目——O2O_优惠券使用情况分析(五)
Python实战项目——O2O_优惠券使用情况分析(五)
|
9天前
|
机器学习/深度学习 自然语言处理 算法
如何使用Python进行文本处理和分析
在现代数据科学中,文本处理和分析是一项重要的技能。无论是从社交媒体、新闻文章还是其他来源,我们都可以获得大量的文本数据。Python作为一种功能强大而灵活的编程语言,提供了许多库和工具来处理和分析文本数据。
20 0
|
14天前
|
机器学习/深度学习 监控 数据处理
Python中进行特征重要性分析的9个常用方法
特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征,它是机器学习中经常使用的一种方法。
29 0
|
15天前
|
前端开发 关系型数据库 MySQL
基于 Python Django 的旅游城市关键词分析和提取
基于 Python Django 的旅游城市关键词分析和提取
|
19天前
|
存储 数据处理 Python
Python基础知识详解:数据类型、对象结构、运算符完整分析
Python基础知识详解:数据类型、对象结构、运算符完整分析
19 1
|
24天前
|
数据采集 数据可视化 数据挖掘
利用Python和pandas分析瑞幸和茅台联名咖啡的市场策略
利用Python和pandas分析瑞幸和茅台联名咖啡的市场策略
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
【Python入门系列】第十七篇:Python大数据处理和分析
大数据处理和分析是指对大规模数据集进行收集、存储、处理和分析的过程。随着互联网和信息技术的发展,我们可以轻松地获取到大量的数据,这些数据包含着宝贵的信息和洞察力。然而,由于数据量庞大、复杂性高和多样性,传统的数据处理和分析方法已经无法胜任。
46 0
|
1月前
|
算法 数据处理 数据库
生物学经典Blast序列比对算法原理,如何在R语言和Python中实现序列的比对分析?
生物学经典Blast序列比对算法原理,如何在R语言和Python中实现序列的比对分析?
|
1月前
|
IDE 数据挖掘 Linux
Python学习笔记丨生信分析的另外一把刷子
Python学习笔记丨生信分析的另外一把刷子
|
1月前
|
算法 数据可视化 数据挖掘
知识图谱入门:使用Python创建知识图,分析并训练嵌入模型
本文中我们将解释如何构建KG、分析它以及创建嵌入模型。
80 2
推荐文章
更多