Python--Matplotlib库与数据可视化②--常见图形的绘制(柱状图,直方图,饼图,箱线图)

简介: Python--Matplotlib库与数据可视化②--常见图形的绘制(柱状图,直方图,饼图,箱线图)

获取数据

以从Tushare获取到的伯特利(‘603596.SH’)的行情数据为例:

import tushare as ts
import pandas as pd
import matplotlib.pyplot as plt
token = 'Your token'   # 这里,需要输入你的接口密匙。
pro = ts.pro_api(token)
df = pro.daily(ts_code='603596.SH')   # 获取日行情的接口。
df1 = df.loc[:, ['trade_date', 'open', 'high', 'low', 'close']]
df1.rename(
    columns={
        'trade_date': 'Date', 'open': 'Open',
        'high': 'High', 'low': 'Low',
        'close': 'Close'},
    inplace=True)
df1['Date'] = pd.to_datetime(df1['Date'])  
# 将日期列作为行索引
df1.set_index(['Date'], inplace=True)
df1 = df1.sort_index()
Close = df1.Close[-50:]   # 取近50天的价格数据作为示例

1. 柱状图(Bar charts)

  • 柱状图主要用于表示定性数据的频数分布,能够直观地展现变量的分布情况。一般情况下,柱状图的X轴表示定性变量的各个取值,Y轴则表示各个取值的频数。

1.1 先简要分析一下数据

  • 绘制柱状图前,可以先简要分析一下数据的最大值,最小值,中位数,平均数等信息,这些信息可以通过调用describe()函数获得。
Close.describe()

在这里插入图片描述

1.2 使用bar()函数绘制基本柱状图

  • pyplot包中的bar()函数可以用于绘制柱状图:
  • matplotlib.pyplot.bar(x, height, width=0.8, hold=None, data=None, **kwargs)
# 首先生成频数列表
a = [0, 0, 0, 0]
for i in Close:
    if (i>24)&(i<=28):
        a[0] += 1
    elif (i>28)&(i<=32):
        a[1] += 1
    elif (i>32)&(i<=36):
        a[2] += 1
    else:
        a[3] += 1    

# 查看一下a
在这里插入图片描述

# 绘制柱状图
plt.bar(['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], a)

效果如图所示:
在这里插入图片描述

1.3 设置位置与大小

left和height分别用于设置每根棒的X轴位置和高度
width参数用于调节棒的宽度
bottom用于设定棒底部的Y轴坐标,即不一定紧贴X轴,可以设成“凌空”位置。
示例如下:

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(x=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], \
height=a, width=1.0, bottom=5.0)
plt.title('伯特利近50天收盘价分布柱状图')

效果如图所示:
在这里插入图片描述

1.4 设置颜色

  • 棒的颜色用color参数设定,棒的边沿颜色用edgecolor参数设定。
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(x=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], \
height=a, width=1.0, bottom=5.0, color='red',edgecolor='k')
plt.title('伯特利近50天收盘价分布柱状图')

效果如图所示:
在这里插入图片描述

1.5 绘制水平柱状图

绘制水平柱状图可以使用barh()函数,barh()函数的参数形式如下:
matplotlib.pyplot.barh(y, width,height=0.8, left=None, hold=None, **kwargs)

  • y设定棒在y轴的位置。
  • width设定棒的宽度,即一般设定为定性数据的值。
  • height设定棒的竖直高度
  • 代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.barh(['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], a, height=1.0, color='red',edgecolor='k')
plt.title('伯特利近50天收盘价分布柱状图')

效果如图所示:
在这里插入图片描述


2. 直方图

  • 柱形图主要用于展示定性数据的分布。对于定量数据的分布,一般使用直方图来呈现。pyplot包中的**hist()**函数用于绘制直方图。

2.1 使用hist()函数绘制直方图

代码示例:

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close,bins=12)
plt.title('伯特利近50天收盘价分布直方图')

效果如图所示:
在这里插入图片描述

2.2 hist()参数形式

matplotlib.pyplot.hist(x,bins=10,range=None,\
normed=False, weights=None, cumulatives=False,\
bottom=None, histtype='bar', \
orientation='vertical', **kwargs)

将orientation设置为’horizontal’,可以绘制水平直方图。
通过color参数设定颜色
通过edgecolor设定边沿颜色
代码示例如下:

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close, range=(25,40), orientation='horizontal', \
color='red', edgecolor='blue')
plt.title('伯特利近50天收盘价分布直方图')

效果如图所示:
在这里插入图片描述

2.3 累积分布直方图

只需将cumulative参数设置为True即可。
此外,参数histtype设定直方图的类型,改参数可以的取值有bar,barstacked,step或stepfilled,分别表示直方图对栈图无填充的线图有填充的线图四种。

  • 绘制累计分布直方图代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close, range=(25,40), orientation='vertical', \
cumulative=True, histtype='stepfilled', color='red', edgecolor='blue')
plt.title('伯特利近50天收盘价累积分布直方图')

效果如图所示:
在这里插入图片描述


3. 饼图(Pie Plot)

  • 饼图能够很方便地表现出每一部分占总体的比例。饼图用**pie()**函数绘制,该函数的主要形式如下:
  • matplotlib.pyplot.pie(x, labels=None, color=None, shadow=False)
  • labels: 用于设定扇形图的标签,为字符串序列类型。
  • colors:用于设定扇形图的颜色,为字符串序列类型。
  • shadow:用于设定是否有阴影,取值为True或False。默认为False。
  • 绘制饼图示例:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.pie(a, labels=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], colors=('b', 'g', 'r', 'c'), shadow=True)
plt.title('伯特利近50天收盘价分布饼状图')

效果如图所示:
在这里插入图片描述

4.箱形图(Box Plot)(也称“箱线图”)

4.1 简况

  • 箱线图由一个矩形和两条线组成。矩形的上边和下边分别是变量的上四分位数和下四分位数;中间有一条线用来表示变量的中位数。在矩形的上下边各延伸出一条线,每条线的长度一般为1.5倍四分位距(四分位距即上下四分位数之差),这两条先被视为异常值的截断线,上端的线为上边缘线,下端的线为下边缘线。线外的点一般被认为是异常值。
  • 箱线图能够很直观地表现出一个变量的分布,也有助于检测异常值。

4.2 boxplot()函数

使用pyplot中的boxplot函数绘制箱形图,该函数主要形式为:

  • matplotlib.pyplot.boxplot(x,notch=None, labels=None)

参数x:要绘制的图形数据,可以是数组形式,也可以是多个向量序列。
参数notch:箱线图的类型,为布尔类型,默认为False,表示绘制矩形箱(rectangular box);如果取值为True,则表示绘制锯齿状箱形图(notched box)。
参数labels:表示箱形图的标签,一般为字符串序列类型。
代码示例如下:

plt.rcParams['font.sans-serif'] = ['SimHei']
import numpy as np
data=np.array(df1)
plt.boxplot(data,labels=('Open', 'High', 'Low', 'Close'))
plt.title("伯特利股价箱线图")

效果如图所示:
在这里插入图片描述
上一话:
Python–Matplotlib库与数据可视化①–修改图像属性

下一话:
Python–Matplotlib库与数据可视化③–Figures、Axes对象与多图绘制

目录
相关文章
|
3月前
|
数据可视化 关系型数据库 MySQL
基于python大数据的的海洋气象数据可视化平台
针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。
|
4月前
|
机器学习/深度学习 数据可视化 搜索推荐
基于python的汽车数据可视化、推荐及预测系统
本研究围绕汽车数据可视化、推荐及预测系统展开,结合大数据与人工智能技术,旨在提升用户体验与市场竞争力。内容涵盖研究背景、意义、相关技术如 Python、ECharts、协同过滤及随机森林回归等,探讨如何挖掘汽车数据价值,实现个性化推荐与智能预测,为汽车行业智能化发展提供支持。
|
4月前
|
数据采集 Web App开发 自然语言处理
新闻热点一目了然:Python爬虫数据可视化
新闻热点一目了然:Python爬虫数据可视化
|
4月前
|
数据采集 数据可视化 关系型数据库
基于python大数据的电影数据可视化分析系统
电影分析与可视化平台顺应电影产业数字化趋势,整合大数据处理、人工智能与Web技术,实现电影数据的采集、分析与可视化展示。平台支持票房、评分、观众行为等多维度分析,助力行业洞察与决策,同时提供互动界面,增强观众对电影文化的理解。技术上依托Python、MySQL、Flask、HTML等构建,融合数据采集与AI分析,提升电影行业的数据应用能力。
|
4月前
|
数据采集 搜索推荐 数据可视化
基于python大数据的商品数据可视化及推荐系统
本系统基于Python、Django与ECharts,构建大数据商品可视化及推荐平台。通过爬虫获取商品数据,利用可视化技术呈现销售趋势与用户行为,结合机器学习实现个性化推荐,助力电商精准营销与用户体验提升。
|
4月前
|
数据可视化 大数据 数据挖掘
基于python大数据的招聘数据可视化分析系统
本系统基于Python开发,整合多渠道招聘数据,利用数据分析与可视化技术,助力企业高效决策。核心功能包括数据采集、智能分析、可视化展示及权限管理,提升招聘效率与人才管理水平,推动人力资源管理数字化转型。
|
5月前
|
搜索推荐 算法 数据可视化
基于python大数据的招聘数据可视化及推荐系统
本研究聚焦于基于协同过滤的就业推荐系统设计与实现。随着就业压力增大和信息技术发展,传统求职方式面临挑战。通过分析用户行为与职位特征,协同过滤技术可实现个性化职位推荐,提升求职与招聘效率。研究涵盖系统架构、数据采集、算法实现及可视化展示,旨在优化就业匹配,促进人才与岗位精准对接,助力就业市场智能化发展。
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
|
数据可视化 数据挖掘 Linux
震撼发布!Python数据分析师必学,Matplotlib与Seaborn数据可视化实战全攻略!
在数据科学领域,数据可视化是连接数据与洞察的桥梁,能让复杂的关系变得直观。本文通过实战案例,介绍Python数据分析师必备的Matplotlib与Seaborn两大可视化工具。首先,通过Matplotlib绘制基本折线图;接着,使用Seaborn绘制统计分布图;最后,结合两者在同一图表中展示数据分布与趋势,帮助你提升数据可视化技能,更好地讲述数据故事。
346 1
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
583 8