获取数据
以从Tushare获取到的伯特利(‘603596.SH’)的行情数据为例:
import tushare as ts
import pandas as pd
import matplotlib.pyplot as plt
token = 'Your token' # 这里,需要输入你的接口密匙。
pro = ts.pro_api(token)
df = pro.daily(ts_code='603596.SH') # 获取日行情的接口。
df1 = df.loc[:, ['trade_date', 'open', 'high', 'low', 'close']]
df1.rename(
columns={
'trade_date': 'Date', 'open': 'Open',
'high': 'High', 'low': 'Low',
'close': 'Close'},
inplace=True)
df1['Date'] = pd.to_datetime(df1['Date'])
# 将日期列作为行索引
df1.set_index(['Date'], inplace=True)
df1 = df1.sort_index()
Close = df1.Close[-50:] # 取近50天的价格数据作为示例
1. 柱状图(Bar charts)
- 柱状图主要用于表示定性数据的频数分布,能够直观地展现变量的分布情况。一般情况下,柱状图的X轴表示定性变量的各个取值,Y轴则表示各个取值的频数。
1.1 先简要分析一下数据
- 绘制柱状图前,可以先简要分析一下数据的最大值,最小值,中位数,平均数等信息,这些信息可以通过调用describe()函数获得。
Close.describe()

1.2 使用bar()函数绘制基本柱状图
- pyplot包中的bar()函数可以用于绘制柱状图:
- matplotlib.pyplot.bar(x, height, width=0.8, hold=None, data=None, **kwargs)
# 首先生成频数列表
a = [0, 0, 0, 0]
for i in Close:
if (i>24)&(i<=28):
a[0] += 1
elif (i>28)&(i<=32):
a[1] += 1
elif (i>32)&(i<=36):
a[2] += 1
else:
a[3] += 1
# 查看一下a
# 绘制柱状图
plt.bar(['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], a)
效果如图所示:
1.3 设置位置与大小
left和height分别用于设置每根棒的X轴位置和高度
width参数用于调节棒的宽度
bottom用于设定棒底部的Y轴坐标,即不一定紧贴X轴,可以设成“凌空”位置。
示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(x=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], \
height=a, width=1.0, bottom=5.0)
plt.title('伯特利近50天收盘价分布柱状图')
效果如图所示:
1.4 设置颜色
- 棒的颜色用color参数设定,棒的边沿颜色用edgecolor参数设定。
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(x=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], \
height=a, width=1.0, bottom=5.0, color='red',edgecolor='k')
plt.title('伯特利近50天收盘价分布柱状图')
效果如图所示:
1.5 绘制水平柱状图
绘制水平柱状图可以使用barh()函数,barh()函数的参数形式如下:
matplotlib.pyplot.barh(y, width,height=0.8, left=None, hold=None, **kwargs)
- y设定棒在y轴的位置。
- width设定棒的宽度,即一般设定为定性数据的值。
- height设定棒的竖直高度
- 代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.barh(['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], a, height=1.0, color='red',edgecolor='k')
plt.title('伯特利近50天收盘价分布柱状图')
效果如图所示:
2. 直方图
- 柱形图主要用于展示定性数据的分布。对于定量数据的分布,一般使用直方图来呈现。pyplot包中的**hist()**函数用于绘制直方图。
2.1 使用hist()函数绘制直方图
代码示例:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close,bins=12)
plt.title('伯特利近50天收盘价分布直方图')
效果如图所示:
2.2 hist()参数形式
matplotlib.pyplot.hist(x,bins=10,range=None,\
normed=False, weights=None, cumulatives=False,\
bottom=None, histtype='bar', \
orientation='vertical', **kwargs)
将orientation设置为’horizontal’,可以绘制水平直方图。
通过color参数设定颜色
通过edgecolor设定边沿颜色
代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close, range=(25,40), orientation='horizontal', \
color='red', edgecolor='blue')
plt.title('伯特利近50天收盘价分布直方图')
效果如图所示:
2.3 累积分布直方图
只需将cumulative参数设置为True即可。
此外,参数histtype设定直方图的类型,改参数可以的取值有bar,barstacked,step或stepfilled,分别表示直方图,对栈图,无填充的线图和有填充的线图四种。
- 绘制累计分布直方图代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.hist(Close, range=(25,40), orientation='vertical', \
cumulative=True, histtype='stepfilled', color='red', edgecolor='blue')
plt.title('伯特利近50天收盘价累积分布直方图')
效果如图所示:
3. 饼图(Pie Plot)
- 饼图能够很方便地表现出每一部分占总体的比例。饼图用**pie()**函数绘制,该函数的主要形式如下:
- matplotlib.pyplot.pie(x, labels=None, color=None, shadow=False)
- labels: 用于设定扇形图的标签,为字符串序列类型。
- colors:用于设定扇形图的颜色,为字符串序列类型。
- shadow:用于设定是否有阴影,取值为True或False。默认为False。
- 绘制饼图示例:
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.pie(a, labels=['(24,28]', '(28, 32]', '(32, 36]', '(36, 40]'], colors=('b', 'g', 'r', 'c'), shadow=True)
plt.title('伯特利近50天收盘价分布饼状图')
效果如图所示:
4.箱形图(Box Plot)(也称“箱线图”)
4.1 简况
- 箱线图由一个矩形和两条线组成。矩形的上边和下边分别是变量的上四分位数和下四分位数;中间有一条线用来表示变量的中位数。在矩形的上下边各延伸出一条线,每条线的长度一般为1.5倍四分位距(四分位距即上下四分位数之差),这两条先被视为异常值的截断线,上端的线为上边缘线,下端的线为下边缘线。线外的点一般被认为是异常值。
- 箱线图能够很直观地表现出一个变量的分布,也有助于检测异常值。
4.2 boxplot()函数
使用pyplot中的boxplot函数绘制箱形图,该函数主要形式为:
- matplotlib.pyplot.boxplot(x,notch=None, labels=None)
参数x:要绘制的图形数据,可以是数组形式,也可以是多个向量序列。
参数notch:箱线图的类型,为布尔类型,默认为False,表示绘制矩形箱(rectangular box);如果取值为True,则表示绘制锯齿状箱形图(notched box)。
参数labels:表示箱形图的标签,一般为字符串序列类型。
代码示例如下:
plt.rcParams['font.sans-serif'] = ['SimHei']
import numpy as np
data=np.array(df1)
plt.boxplot(data,labels=('Open', 'High', 'Low', 'Close'))
plt.title("伯特利股价箱线图")
效果如图所示:
上一话:
Python–Matplotlib库与数据可视化①–修改图像属性