利用Pandas探究自行车租赁随时间及天气变化的分布情况并可视化(附源码 超详细)

简介: 利用Pandas探究自行车租赁随时间及天气变化的分布情况并可视化(附源码 超详细)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

下面以自行车租赁统计数据为例,使用Pandas中的时间序列分析方法,探究自行车租赁数据随时间以及天气变化的分布情况,数据来自Kaggle网站

1:导入模块

import numpy as np
import pandas as pd
import datetime
import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize = (10,8))
%matplotlib inline

2:获取数据 导入待处理数据bike.csv  并显示前五行

bike = pd.read_csv('data//bike.csv')
bike.head()

3:分析数据

首先查看有无缺失值

bike.isnull().sum()

然后查看待处理数据的数据类型

bike.info()

然后将字段datetime的类型转换为日期时间

bike.datetime = pd.to_datetime(bike.datetime)
bike.dtypes

先从数值型数据入手,可以看出租赁额(count)数值差异大,所以希望观察一下它们的密度分布

sns.distplot(bike["count"])
# plt.plot(s.index,s.values)#作图

从运行结果发现 有长尾现象

显示count字段的描述信息

bike["count"].describe()

将count列中小于第一四分位数的数据删除 并绘制对应的密度图

def Count(x):
    if x <42:
        return np.nan
    else:
        return x
bike1 = bike
bike1["count"] = bike1["count"].apply(Count)
bike1 = bike1.dropna(axis=0, how='any')
sns.distplot(bike1["count"])

对数据进行处理后长尾现象有所改善

接下来绘制按年份统计自行车租赁数均值的直方图

y_bike.plot(kind='bar',rot = 0)

重采样 按月进行分析汇总

mm_bike = bike.resample('M',kind = "period").mean()
mm_bike.head()

然后按月统计数据的绘图

mm_bike.plot()
plt.legend(loc = "best",fontsize = 8)

绘图观察哪个月份自行车的租赁数目最大

m_bike.plot()
plt.grid()# 9月份达到最大值

从图中可以看出 9月份自行车租赁数最多

分析每天不同时间自行车租赁数量的变化

h_bike.plot("bar",rot = 0)

从图中可以发现 每天八点和十七点自行车租赁数量最多 对应这个时候上下班和上下学的人数较多

接下来分析季节对租赁数额的影响

season_bike = bike.groupby(bike.season).mean()['count']
season_bike 
season_bike.plot(kind = "bar",rot = 0)

接下来分析温度对租赁数额的影响

temp_bike = bike.groupby([bike.temp]).mean()['count']
temp_bike.sample(10)
temp_bike.plot()

然后分析风速对租赁数额的影响

wind_bike_sort = wind_bike.sort_values(ascending=False)
wind_bike_sort.head(20).plot(kind="bar",rot = 60)

最后分析天气对租赁数额的影响

weather_bike = bike.groupby(bike.weather).mean()['count']
weather_bike.plot(kind='bar',rot = 0)

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
5月前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
89 1
|
2月前
|
数据可视化 数据挖掘 Python
Pandas数据探索性可视化的最佳实践
【10月更文挑战第13天】数据可视化是数据分析中不可或缺的一环,它帮助我们更好地理解数据、发现趋势和模式,并有效地传达我们的发现。在Python领域,Pandas和Matplotlib是两个非常强大的库,它们提供了丰富的功能来进行数据分析和可视化。本文将介绍如何结合使用Pandas和Matplotlib进行数据探索性可视化的最佳实践。
64 9
|
2月前
|
数据采集 数据可视化 数据挖掘
Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
【10月更文挑战第3天】Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
134 0
|
4月前
|
数据可视化 Python
Pandas可视化指南:从零教你绘制数据图表
Pandas可视化指南:从零教你绘制数据图表
|
5月前
|
机器学习/深度学习 数据可视化 搜索推荐
Pandas 和 Matplotlib 可视化
【7月更文挑战第14天】Pandas 和 Matplotlib 是Python数据分析的核心库,用于数据探索性可视化。首先,通过`pip install pandas matplotlib`安装库。接着,使用`pd.read_csv()`加载CSV数据,`df.describe()`查看统计信息。利用Matplotlib的`hist()`, `scatter()`, 和 `boxplot()`绘制直方图、散点图和箱线图,展示数据分布和关系。通过`subplots()`创建多图展示,自定义样式如颜色、标记,并添加注释和标题。高级技巧包括热力图、时间序列图、分组可视化及Seaborn和Plotly
59 10
|
4月前
|
存储 数据可视化 数据挖掘
Python 3 中使用 pandas 和 Jupyter Notebook 进行数据分析和可视化
Python 3 中使用 pandas 和 Jupyter Notebook 进行数据分析和可视化
76 0
|
6月前
|
SQL 缓存 算法
【源码解析】Pandas PandasObject类详解的学习与实践
【源码解析】Pandas PandasObject类详解的学习与实践
|
6月前
|
存储 SQL 算法
【源码解析】深入解析 pandas的Block 类中算术运算和重排实现
【源码解析】深入解析 pandas的Block 类中算术运算和重排实现
|
6月前
|
存储 数据挖掘 数据处理
【python源码解析】深入 Pandas BlockManager 的数据结构和初始化过程
【python源码解析】深入 Pandas BlockManager 的数据结构和初始化过程
|
6月前
|
数据可视化 数据挖掘 数据处理
【源码解析】深入Pandas的心脏DataFrame 含十大功能、源码实现与编程知识点
【源码解析】深入Pandas的心脏DataFrame 含十大功能、源码实现与编程知识点