python分析各因素之间的相关性,特别是其他因素与评分的相关性

简介: python分析各因素之间的相关性,特别是其他因素与评分的相关性

电影信息的各个属性(字段)之间存在相关性,选取budget,popularity,release_date,revenue,runtime,status,vote_average,vote_count字段作为分析对象

相关系数矩阵

每个子图都是每个维度和其他某个维度的相关关系图,这其中主对角线上的图,则是每个维度的数据分布直方图。其中可以看出各因素间相关性强弱的大小。

其中与评分相关性较强的因素有电影的popularity(流行度),runtime(电影时长),vote_count(影评人数) ,revenue(电影收益)。

代码部分:

1. import pandas as pd 
2. data_m=pd.read_csv("data/项目一/data_mo.csv")
3. data_m
1. data_corr=data_m[["budget","popularity","release_date","revenue","runtime","status","vote_average","vote_count"]]
2. 
3. data_corr
1. # 保留年份
2. data_corr.release_date=data_corr.release_date.str.split("-",expand=True)[0]
3. data_corr.release_date=data_corr.release_date.astype(int)

# 每个子图都是每个维度和其他某个维度的相关关系图,这其中主对角线上的图,则是每个维度的数据分布直方图。

# 而第二行代码是画出同样的图形,但却以vote_average这个维度的数据为标准,来对各个数据点进行着色,其结果如图所示。

# 从图中可以看出,vote_average这列数据共10个不同的数值,每个数值一种颜色,所以生成的图是彩色的

1. import seaborn as sns
2. 
3. sns.pairplot(data_corr)
4. sns.pairplot(data_corr , hue ='vote_average')
5. # 每个子图都是每个维度和其他某个维度的相关关系图,这其中主对角线上的图,则是每个维度的数据分布直方图。
6. # 而第二行代码是画出同样的图形,但却以vote_average这个维度的数据为标准,来对各个数据点进行着色,其结果如图所示。
7. # 从图中可以看出,vote_average这列数据共10个不同的数值,每个数值一种颜色,所以生成的图是彩色的

热力图

通过相关系数矩阵与热力图分析各个字段间的相关性,各个字段间的相关系数在表中都呈现了强弱不同的关系

1. import matplotlib.pyplot as plt
2. figure, ax = plt.subplots(figsize=(12, 12))
3. sns.heatmap(data_corr.corr(), square=True, annot=True, ax=ax)

通过热力图可以看到电影的popularity,runtime,vote_count,revenue与电影的评分vote_average存在较强的相关性与budget,release_datet相关性较弱


相关文章
|
9天前
|
数据采集 数据可视化 索引
【python】python股票量化交易策略分析可视化(源码+数据集+论文)【独一无二】
【python】python股票量化交易策略分析可视化(源码+数据集+论文)【独一无二】
|
3天前
|
机器学习/深度学习 数据采集 数据可视化
使用Python实现深度学习模型:智能舆情监测与分析
【8月更文挑战第16天】 使用Python实现深度学习模型:智能舆情监测与分析
15 1
|
7天前
|
存储 JSON 数据可视化
用Python分析S11决赛EDGvsDK,教你怎么硬核吹EDG
用Python分析S11决赛EDGvsDK,教你怎么硬核吹EDG
21 4
用Python分析S11决赛EDGvsDK,教你怎么硬核吹EDG
|
10天前
|
算法 搜索推荐 数据挖掘
【2024年华数杯全国大学生数学建模竞赛】C题:老外游中国 问题思路分析及Python代码实现
本文提供了2024年华数杯全国大学生数学建模竞赛C题“老外游中国”的解题思路分析和Python代码实现,涉及景点评分统计、城市综合评价、游玩路线规划以及特定条件下的旅游优化问题。
51 6
【2024年华数杯全国大学生数学建模竞赛】C题:老外游中国 问题思路分析及Python代码实现
|
7天前
|
算法 程序员 开发工具
百万级Python讲师又一力作!Python编程轻松进阶,豆瓣评分8.1
在学习Python的旅程中你是否正在“绝望的沙漠”里徘徊? 学完基础教程的你,是否还在为选择什么学习资料犹豫不决,不知从何入手,提高自己?
百万级Python讲师又一力作!Python编程轻松进阶,豆瓣评分8.1
|
5天前
|
算法 程序员 开发工具
百万级Python讲师又一力作!Python编程轻松进阶,豆瓣评分8.1
在学习Python的旅程中你是否正在“绝望的沙漠”里徘徊? 学完基础教程的你,是否还在为选择什么学习资料犹豫不决,不知从何入手,提高自己?
|
3天前
|
设计模式 JSON 程序员
豆瓣评分9.4!Python程序员必读的《流畅的Python》,放这里了!
Python 官方教程的开头是这样写的:“Python 是一门既容易上手又强大的编程语言。””这句话本身并无大碍,但需要注意的是,正因为它既好学又好用,所以很多Python程序员只用到了其强大功能的一小部分,只需要几个小时,经验丰富的程序员就能学会用 Python 写出实用的程序。 然而随着这最初高产的几个小时变成数周甚至数月,在那些先入为主的编程语言的影响下,开发者们会慢慢地写出带着“口音”的 Python 代码。即便 Python 是你的初恋,也难逃此命运。因为在学校里,亦或是那些入门书上,教授者往往会有意避免只跟语言本身相关的特性。
|
4天前
|
设计模式 JSON 程序员
豆瓣评分9.4!Python程序员必读的《流畅的Python》,放这里了!
Python 官方教程的开头是这样写的:“Python 是一门既容易上手又强大的编程语言。””这句话本身并无大碍,但需要注意的是,正因为它既好学又好用,所以很多Python程序员只用到了其强大功能的一小部分,只需要几个小时,经验丰富的程序员就能学会用 Python 写出实用的程序。 然而随着这最初高产的几个小时变成数周甚至数月,在那些先入为主的编程语言的影响下,开发者们会慢慢地写出带着“口音”的 Python 代码。即便 Python 是你的初恋,也难逃此命运。因为在学校里,亦或是那些入门书上,教授者往往会有意避免只跟语言本身相关的特性。
|
6天前
|
编解码 算法 Linux
Linux平台下RTSP|RTMP播放器如何跟python交互投递RGB数据供视觉算法分析
在对接Linux平台的RTSP播放模块时,需将播放数据同时提供给Python进行视觉算法分析。技术实现上,可在播放时通过回调函数获取视频帧数据,并以RGB32格式输出。利用`SetVideoFrameCallBackV2`接口设定缩放后的视频帧回调,以满足算法所需的分辨率。回调函数中,每收到一帧数据即保存为bitmap文件。Python端只需读取指定文件夹中的bitmap文件,即可进行视频数据的分析处理。此方案简单有效,但应注意控制输出的bitmap文件数量以避免内存占用过高。
|
9天前
|
存储 供应链 数据可视化
【python】python 大型商超会员数据研究分析可视化 (源码+数据集+论文)【独一无二】
【python】python 大型商超会员数据研究分析可视化 (源码+数据集+论文)【独一无二】