利用Pandas探究自行车租赁随时间及天气变化的分布情况并可视化(附源码 超详细)

简介: 利用Pandas探究自行车租赁随时间及天气变化的分布情况并可视化(附源码 超详细)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

下面以自行车租赁统计数据为例,使用Pandas中的时间序列分析方法,探究自行车租赁数据随时间以及天气变化的分布情况,数据来自Kaggle网站

1:导入模块

import numpy as np
import pandas as pd
import datetime
import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize = (10,8))
%matplotlib inline

2:获取数据 导入待处理数据bike.csv  并显示前五行

bike = pd.read_csv('data//bike.csv')
bike.head()

3:分析数据

首先查看有无缺失值

bike.isnull().sum()

然后查看待处理数据的数据类型

bike.info()

然后将字段datetime的类型转换为日期时间

bike.datetime = pd.to_datetime(bike.datetime)
bike.dtypes

先从数值型数据入手,可以看出租赁额(count)数值差异大,所以希望观察一下它们的密度分布

sns.distplot(bike["count"])
# plt.plot(s.index,s.values)#作图

从运行结果发现 有长尾现象

显示count字段的描述信息

bike["count"].describe()

将count列中小于第一四分位数的数据删除 并绘制对应的密度图

def Count(x):
    if x <42:
        return np.nan
    else:
        return x
bike1 = bike
bike1["count"] = bike1["count"].apply(Count)
bike1 = bike1.dropna(axis=0, how='any')
sns.distplot(bike1["count"])

对数据进行处理后长尾现象有所改善

接下来绘制按年份统计自行车租赁数均值的直方图

y_bike.plot(kind='bar',rot = 0)

重采样 按月进行分析汇总

mm_bike = bike.resample('M',kind = "period").mean()
mm_bike.head()

然后按月统计数据的绘图

mm_bike.plot()
plt.legend(loc = "best",fontsize = 8)

绘图观察哪个月份自行车的租赁数目最大

m_bike.plot()
plt.grid()# 9月份达到最大值

从图中可以看出 9月份自行车租赁数最多

分析每天不同时间自行车租赁数量的变化

h_bike.plot("bar",rot = 0)

从图中可以发现 每天八点和十七点自行车租赁数量最多 对应这个时候上下班和上下学的人数较多

接下来分析季节对租赁数额的影响

season_bike = bike.groupby(bike.season).mean()['count']
season_bike 
season_bike.plot(kind = "bar",rot = 0)

接下来分析温度对租赁数额的影响

temp_bike = bike.groupby([bike.temp]).mean()['count']
temp_bike.sample(10)
temp_bike.plot()

然后分析风速对租赁数额的影响

wind_bike_sort = wind_bike.sort_values(ascending=False)
wind_bike_sort.head(20).plot(kind="bar",rot = 60)

最后分析天气对租赁数额的影响

weather_bike = bike.groupby(bike.weather).mean()['count']
weather_bike.plot(kind='bar',rot = 0)

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
12天前
|
JSON 数据挖掘 数据格式
Pandas中Series、DataFrame讲解及操作详解(超详细 附源码)
Pandas中Series、DataFrame讲解及操作详解(超详细 附源码)
127 0
|
12天前
|
存储 JSON 关系型数据库
Pandas载入txt、csv、Excel、JSON、数据库文件讲解及实战(超详细 附源码)
Pandas载入txt、csv、Excel、JSON、数据库文件讲解及实战(超详细 附源码)
68 0
|
9月前
|
数据可视化 数据挖掘 大数据
Pandas+Pyecharts | 北京某平台二手房数据分析可视化
Pandas+Pyecharts | 北京某平台二手房数据分析可视化
|
7月前
|
数据可视化 数据挖掘 数据处理
【100天精通Python】Day61:Python 数据分析_Pandas可视化功能:绘制饼图,箱线图,散点图,散点图矩阵,热力图,面积图等(示例+代码)
【100天精通Python】Day61:Python 数据分析_Pandas可视化功能:绘制饼图,箱线图,散点图,散点图矩阵,热力图,面积图等(示例+代码)
204 0
|
12天前
|
数据采集 数据可视化 数据挖掘
如何利用Python中的Pandas库进行数据分析和可视化
Python的Pandas库是一种功能强大的工具,可以用于数据分析和处理。本文将介绍如何使用Pandas库进行数据分析和可视化,包括数据导入、清洗、转换以及基本的统计分析和图表绘制。通过学习本文,读者将能够掌握利用Python中的Pandas库进行高效数据处理和可视化的技能。
|
12天前
|
数据可视化 数据挖掘 索引
利用Python中的Pandas库进行数据分析与可视化
本文介绍了如何利用Python中的Pandas库进行数据分析与可视化。通过Pandas提供的强大功能,我们可以轻松地加载、清洗、处理和分析各种类型的数据。
|
12天前
|
存储 数据可视化 数据挖掘
数据分析与可视化:Pandas与Matplotlib/Seaborn的完美结合
【4月更文挑战第16天】本文探讨了Python中的Pandas、Matplotlib和Seaborn如何协同进行数据分析与可视化。Pandas提供高效的数据结构DataFrame,便于数据处理和清洗;Matplotlib是基础绘图库,支持自定义图表;Seaborn则在Matplotlib基础上提供美观的统计图形。通过这三个库的无缝结合,数据分析师可以从数据处理直达可视化,提高效率并呈现更具吸引力的分析结果。掌握这些工具将助力深入理解数据并揭示其中的故事。
|
12天前
|
SQL 数据可视化 数据挖掘
利用Python中的Pandas库进行数据分析和可视化
Python语言中的Pandas库是一个功能强大的工具,可用于数据处理、清洗、分析和可视化。本文将介绍如何利用Pandas库对数据进行处理和分析,并结合Matplotlib库进行数据可视化,帮助读者快速掌握数据分析和可视化的基本方法。
38 3
|
12天前
|
数据可视化 数据挖掘 Python
利用Python和Pandas对小费数据集进行数据分析与可视化实战(超详细 附源码)
利用Python和Pandas对小费数据集进行数据分析与可视化实战(超详细 附源码)
314 0
|
12天前
|
数据可视化 数据挖掘 Linux
【数据分析与可视化】Pandas可视化与数据透视表的讲解及实战(超详细 附源码)
【数据分析与可视化】Pandas可视化与数据透视表的讲解及实战(超详细 附源码)
66 0