【Python数据分析】用Matplotlib绘制其它常见的图像

2022-12-01 380

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 文章目录1️⃣柱状图2️⃣直方图3️⃣散点图4️⃣饼图

1️⃣柱状图

柱状图适用场合是二维数据集（每个数据点包括两个值x和y），但只有一个维度需要比较。例如：年销售额就是二维数据，”年份”和”销售额”就是它的两个维度，但只需要比较”销售额”这一个维度。

绘制折线图使用plt.plot()方法，而绘制柱形图我们使用plt.bar()函数:

plt.bar(x,height,width,color)

代码参数：

x：记录x轴上的标签

height：记录每个柱形的高度

width：设置柱形的宽度

color：设置柱形的颜色，传入颜色值的列表，例如：

[‘blue’,‘green’,‘red’]。

这里就用电影和票房的关系来展示柱状图的优点，看不懂没关系，下面有代码的解释

%matplotlib inline
from matplotlib import pyplot as plt
a = ['流浪地球','疯狂的外星人','飞驰人生','大黄蜂','熊出没·原始时代','新喜剧之王']
b = [38.13,19.85,14.89,11.36,6.47,5.93]
plt.rcParams['font.sans-serif'] = ['SimHei']     #windows下使用这种方法
plt.figure(figsize=(20,8),dpi=80)
# 绘制柱状图
rects = plt.bar(a,b,width=0.2,color=['red','green','blue','cyan','yellow','gray'])
plt.xticks(a,)
plt.yticks(range(0,41,5),range(0,41,5))
# 在条形图上加标注(水平居中)
for rect in rects:
    height = rect.get_height()
    plt.text(rect.get_x() + rect.get_width() / 2, height+0.3, str(height),ha="center")
plt.show()

✨效果

我们使用了plt.text( )函数为每个柱形标注高度数值。

plt.text(x,y,s,ha,va)

函数中：

前两个参数分别为标注数据的坐标，x和y坐标，

参数s记录标注的内容，

参数ha和va分别用于设置水平和垂直方向的对齐方式.

rects是plt.bar()的返回值，里面包含了每一个柱形为每个柱形添加数值标注需要逐个添加，所以我们设置了一个循环来完成这项操作。

for rect in rects:
    height = rect.get_height()
    plt.text(rect.get_x() + rect.get_width() / 2, height+0.3, str(height),ha="center")

通过get_height()、get_x()、rect.get_width()等方法可以分别拿到柱形图的高度，左侧边的x值，柱子的宽度。然后，使用plt.text添加上文字，这样就可以清晰地看出每个柱形的高度了。

2️⃣直方图

直方图一般用来描述等距数据，柱状图一般用来描述名称（类别）数据或顺序数据。

直观上，直方图各个长条形是衔接在一起的，表示数据间的数学关系；

条形图各长条形之间留有空隙，区分不同的类。

plt.hist(data, bins, facecolor, edgecolor)

常用参数

data：绘图用到的数据

bins：控制直方图中的区间个数

facecolor：矩形的填充颜色

edgecolor：条形的边框颜色

%matplotlib inline
from matplotlib import pyplot as plt
time = [131,  98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114,
        119, 128, 121, 142, 127, 130, 124, 101, 110, 116, 117, 110, 128, 128, 115,  99, 
        136, 126, 134,  95, 138, 117, 111,78, 132, 124, 113, 150, 110, 117,  86,  95, 144, 
        105, 126, 130,126, 130, 126, 116, 123, 106, 112, 138, 123,  86, 101,  99, 136,123,
        117, 119, 105, 137, 123, 128, 125, 104, 109, 134, 125, 127,105, 120, 107, 129, 116,
        108, 132, 103, 136, 118, 102, 120, 114,105, 115, 132, 145, 119, 121, 112, 139, 125,
        138, 109, 132, 134,156, 106, 117, 127, 144, 139, 139, 119, 140,  83, 110, 102,123,
        107, 143, 115, 136, 118, 139, 123, 112, 118, 125, 109, 119, 133,112, 114, 122, 109, 
        106, 123, 116, 131, 127, 115, 118, 112, 135,115, 146, 137, 116, 103, 144,  83, 123, 
        111, 110, 111, 100, 154,136, 100, 118, 119, 133, 134, 106, 129, 126, 110, 111, 109, 
        141,120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114, 125, 126,114, 140, 103, 
        130, 141, 117, 106, 114, 121, 114, 133, 137,  92,121, 112, 146,  97, 137, 105,  98, 
        117, 112,  81,  97, 139, 113,134, 106, 144, 110, 137, 137, 111, 104, 117, 100, 111,
        101, 110,105, 129, 137, 112, 120, 113, 133, 112,  83,  94, 146, 133, 101,131, 116, 
        111,  84, 137, 115, 122, 106, 144, 109, 123, 116, 111,111, 133, 150]
plt.rcParams['font.sans-serif'] = ['SimHei']     #windows下使用这种方法
# 2）创建画布
plt.figure(figsize=(20, 8), dpi=100)
# 3）绘制直方图
# 设置组距
distance = 2
# 计算组数
group_num = int((max(time) - min(time)) / distance)
# 绘制直方图
plt.hist(time, bins=group_num)
# 修改x轴刻度显示
plt.xticks(range(min(time), max(time))[::2])
# 添加网格显示
plt.grid(linestyle="--", alpha=0.5)
# 添加x, y轴描述信息
plt.xlabel("电影时长大小")
plt.ylabel("电影的数据量")
# 4）显示图像

✨效果

这样我们就绘制计出这些电影时长的分布状态直方图。我们看到电影时长最多的在110到112之间。

其实，绘制直方图的重点在于设置组距，然后分为若干组。用矩形的高度表示每一组数据的频数。

那么直方图和柱形图究竟有什么区别呢。

第一，柱形图中用柱形的高度表示各类别的数值，横轴表示类别，宽度是固定的；而直方图是用矩形的高度表示每一组的频数或频率，宽度则表示各组的组距，因此其高度与宽度均有意义。

第二，直方图主要用于展示连续型数值型数据，所以各矩形通常是连续排列的；而柱形图主要用于展示分类型数据，常常是分开排列的。

3️⃣散点图

散点图是判断变量之间是否存在数量关联趋势,展示离群点。每个点的坐标位置由变量的值决定，并由一组不连接的点完成，用于观察两种变量的相关性。例如，身高—体重、温度—维度。

常用参数:

x,y：数组

s：散点图中点的大小，可选

c：散点图中点的颜色，可选

marker：散点图的形状，可选

alpha：表示透明度，在 0~1 取值，可选

linewidths：表示线条粗细，可选

plt.scatter(x,y,s,c,marker,alpha,linewidths)

下面就用随机数来演示一下散点图

import pandas as pd
import numpy as np
data = np.random.randint(100, 200, size=(100, 2))
df = pd.DataFrame(data,columns=['身高', '体重'])
df.sort_index(level=0)# 设置图形大小
plt.figure(figsize=(20,8),dpi=80)
# 使用scatter绘制散点图
plt.scatter(df['身高'],df['体重'],alpha=0.5,c='blue')
plt.show()

✨效果

将身高和体重数据分别作为散点图的x轴和y轴数据，并且将点的颜色设置为蓝色，透明度设置为0.5。这样我们就成功绘制计出身高和体重的散点图。

因为这不是真正的数据，所以没有参考的价值，只是用来演示。

4️⃣饼图

startangle：设置起始绘制角度，默认图是从x轴正方向逆时针画起，如果设定startangle=90，则从y轴正方向画起

饼图是展示分类数据的占比情况，就是反映某个部分占整体的比重，比如贫穷人口占总人口的百分比。

饼图的整个圆代表总数据，各个扇形表示每项数据，我们可以根据扇形的角度清楚地看出每个扇形占总数据的比例。

plt.pie(x, labels, autopct, shadow, startangle)

常用参数

x：绘制用到的数据

labels：用于设置饼图中每一个扇形外侧的显示说明文字

autopct：设置饼图内百分比数据，可以使用format字符串或者format function，例如’%.1f%%’指小数点后保留1位小数

shadow：表示是否在饼图下面画阴影，默认值：False，即不画阴影

因为数据量太大，所以这里只演示核心的代码，获取数据就只能用“数据”两字代替了

from matplotlib import pyplot as plt
import pandas as pd
plt.rcdefaults()
plt.rcParams['font.sans-serif'] = ['SimHei'] 
df = pd.read_csv('数据')
# 分组
groups = df.groupby(by='大分类').size()
# 绘制饼图
plt.pie(groups,labels=groups.index, autopct='%.1f%%',startangle=90)
# 图形展示
plt.show()

✨效果

df.groupby(‘大分类’).size()按照类型变量分类对原数据分组，使用groupby函数，然后计算每组数据的数据量，使用size()函数，将输出的数据记录为num。(忘记的可以重新回去看看)

plt.pie()会有三个返回值

patches: matplotlib.patches.Wedge列表(扇形实例)

l_text：label matplotlib.text.Text列表(标签实例)

p_text：label matplotlib.text.Text列表(百分比标签实例)

【Python数据分析】用Matplotlib绘制其它常见的图像

1️⃣柱状图

2️⃣直方图

3️⃣散点图

4️⃣饼图

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【Python数据分析】用Matplotlib绘制其它常见的图像

1️⃣柱状图

2️⃣直方图

3️⃣散点图

4️⃣饼图

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像