python数据分析之Matplotlib学习笔记

简介: 简介:这一篇是关于数分三剑客之一–matplotlib的一些学习笔记。

前言


这一篇是关于数分三剑客之一–matplotlib的一些学习笔记。

它的功能非常强大,可以让枯燥的数据“美腻”起来,那么先来看一下官方给的一些样图:

官方提供的各种各样的样图


一、基本组成


1、Figure

说到绘图,那必须要有一个画板。Figure作为一个“老画板”,在matlab中经常能看到它的出没,在python中,它的具体语法是什么呢?让我们来看一下。

figure(num, figsize, dpi, facecolor, edgecolor, frameon)
  • 六个参数的含义:

num:画板的编号;

figsize:指定画板的长和高;

dpi:绘图对象的参数;

facecolor:背景颜色;

edgecolor:边框颜色;

frameon:是否需要显示边框;

2、Axes

数学图形怎么能离开坐标轴呢?

创建的方法不一、这里利用set函数创建坐标轴。

  • set的五个参数含义:

xlim:x轴的范围 [min,max];

ylim:y轴的范围 [min,max];

xlable:自定义x轴的名称;

ylable:自定义y轴的名称;

title:自定义标题;

如:

import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], xlabel='X', ylabel='Y', title='first-try')
plt.show()

输出:(这里的樱花树,是pycharm的背景,不是代码实现的效果)image.png看了上例,ax = fig.add_subplot(111)的作用是啥呀?

其实,这部分和matlab中的subplot作用一样,就是在一个打的区域,布置“几个”(可以是1个)画板。

这里面的三个数字可以这么理解:第一个数字代表几行,第二个数字代表几列,第三个数字代表第几个(顺序是自左向右,自上到下)


如:

import matplotlib.pyplot as plt
fig = plt.figure()
ax1 = fig.add_subplot(221)
ax2 = fig.add_subplot(222)
ax3 = fig.add_subplot(224)
plt.show()

输出:image.png


二、常见图表的绘制


  • 开始之前,可以看一下大佬的这篇文章,介绍了很详细的参数值:

matplotlib绘图中与颜色相关的参数(color颜色参数、linestyle线型参数、marker标记参数)可选列表集合

1、折线图

使用plt.plot

import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5, 6]
y = [1, 3, 2, 5, 9, 2]
# 传进去x,y的坐标
plt.plot(x, y)  
plt.show()  

输出:image.png

2、柱形图

使用plt.bar

import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5, 6]
y = [1, 3, 2, 5, 9, 2]
# 传进去x,y的坐标
plt.bar(x, y, color='blue')
plt.show()

输出:image.png

3、饼图

使用plt.pie

import matplotlib.pyplot as plt
name = ['one', 'two', 'three', 'four', 'five', 'six']
x = [1, 3, 2, 5, 9, 2]
plt.pie(x, labels=name, colors=['b', 'r', 'g', 'k', 'c', 'm'])
plt.axis('equal')
plt.show()

输出:image.png

4、散点图

使用plt.scatter

import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5, 6]
y = [1, 3, 2, 5, 9, 2]
# market的作用是用什么记号来标记点
plt.scatter(x, y, color='red', marker='*')
plt.show()

输出:image.png

5、泡泡图

在处理随机数的时候,感觉挺有意思的。

import matplotlib.pyplot as plt
import numpy as np
plt.figure(figsize=(8, 8))
x = np.random.rand(50)
y = np.random.rand(50)
z = np.random.rand(50)
# color代表颜色,alpha代表透明度
plt.scatter(x, y, s=z * 1000, color='b', alpha=0.5)
plt.show()

输出:image.png


三、细节完善


1、坐标轴的完善(移动、“删除”)

对于坐标轴的改动,需要用到plt.gca函数,它有四个参数:top 、bottom、left、right。分别对应上下左右四个轴。如何操作,先看下面的例子。

  • 这个是上面我第一次尝试得到的结果图:image.png改善之后可变成这样(在画函数图像时应该更舒服一些):image.png代码:
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], title='first-try')
bx = plt.gca()
# 将下面的轴(x轴)设置为xaxis
bx.xaxis.set_ticks_position('bottom')
# 将设置后的轴移动到y=0的地方
bx.spines['bottom'].set_position(('data', 0))
bx.yaxis.set_ticks_position('left')
bx.spines['left'].set_position(('data', 0))
# 将不想看到的右、上方向的轴“删除”,其实就是把轴的颜色改为无色
bx.spines['top'].set_color('none')
bx.spines['right'].set_color('none')
plt.show()

2、刻度值的一些操作

  • ①调整刻度值的大小、颜色、显示情况
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], title='first-try')
# 对x、y轴的刻度值进行设置
plt.yticks(fontsize=20, color='#00000')  # y轴刻度值大小为20 ,颜色为黑色
# plt.yticks(fontsize=20, color='black')  # 用black也可以
plt.xticks([])  # [] ,即不显示x轴刻度值
plt.show()

输出:image.png对于颜色转换可以看一下这位大佬的总结:2020 RGB颜色查询大全 #000000 【颜色列表】

  • ②刻度值旋转
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], title='first-try')
fig.autofmt_xdate()  # 默认旋转45°,可以在括号里加rotation=‘角度’
plt.show()

3、图例

import matplotlib.pyplot as plt
from numpy import *
x = linspace(0, 4, 50)  # linspace(A,B,C),指从A开始B结束,中间分布C个值,C默认为100
y1 = x
y2 = x**2
plt.figure()
l1, = plt.plot(x, y1, color='b', linestyle='-')
l2, = plt.plot(x, y2, color='r', linestyle='--')
# handles:需要制作图例的对象;labels:图例的名字;loc:图例的位置,loc的内容可选“best”,最佳位置
plt.legend(handles=[l1, l2], labels=['function1', 'function2'], loc='upper left')
plt.show()

注意:l1后面有个

输出:image.png

4、添加注释(如特殊点)

import matplotlib.pyplot as plt
from numpy import *
x = linspace(0, 4, 50)  # linspace(A,B,C),指从A开始B结束,中间分布C个值,C默认为100
y = x**2
plt.figure()
# 选取需要标注的点
x0 = 1.5
y0 = x0**2
# 作图
plt.plot(x, y)
# 作垂线,
plt.plot([x0, x0], [0, y0], 'k--', linewidth=1)
# 作出标注的点
plt.scatter([x0, ], [y0, ], s=50, color='b')
# 做标注
plt.annotate(r'$x^2=%s$' % y0, xy=(x0, y0), xycoords='data', xytext=(+30, -30),
             textcoords='offset points', fontsize=16,
             arrowprops=dict(arrowstyle='->', connectionstyle="arc3,rad=.2"))
# 参数xycoords='data' 是说基于数据的值来选位置,
# xytext=(+30, -30) 和 textcoords='offset points' 对于标注位置的描述 和 xy 偏差值
# arrowprops是对图中箭头类型的一些设置
plt.show()
  • arrowstyle的格式:
``'-'``        None
``'->'``       head_length=0.4,head_width=0.2
``'-['``       widthB=1.0,lengthB=0.2,angleB=None
``'|-|'``      widthA=1.0,widthB=1.0
``'-|>'``      head_length=0.4,head_width=0.2
``'<-'``       head_length=0.4,head_width=0.2
``'<->'``      head_length=0.4,head_width=0.2
``'<|-'``      head_length=0.4,head_width=0.2
``'<|-|>'``    head_length=0.4,head_width=0.2
``'fancy'``    head_length=0.4,head_width=0.4,tail_width=0.4
``'simple'``   head_length=0.5,head_width=0.5,tail_width=0.2
``'wedge'``    tail_width=0.3,shrink_factor=0.5

输出:image.png


四、图中图


import matplotlib.pyplot as plt
from numpy import *
x = linspace(0, 4, 50)  # linspace(A,B,C),指从A开始B结束,中间分布C个值,C默认为100
y = x**2
fig = plt.figure()
# 这四个数字分别代表的是相对figure的位置
left, bottom, width, height = 0.1, 0.1, 0.8, 0.8
ax1 = fig.add_axes([left, bottom, width, height])
ax1.plot(x, y, 'r')
ax1.set_xlabel('x')
ax1.set_ylabel('y')
ax1.set_title('main')
ax2 = fig.add_axes([0.2, 0.6, 0.25, 0.25])
ax2.plot(y, x, 'b')
ax2.set_xlabel('x')
ax2.set_ylabel('y')
ax2.set_title('children1')
ax3 = fig.add_axes([0.65, 0.2, 0.2, 0.2])
ax3.plot(y, x, 'b')
ax3.set_xlabel('x')
ax3.set_ylabel('y')
ax3.set_title('children2')
plt.show()

输出:image.png这里系统会有提示:This figure includes Axes that are not compatible with tight_layout, so results might be incorrect.

意思为:此图包括与紧固件布局不兼容的轴,因此结果可能不正确。


五、动画制图


前排提示:如果使用pycharm无法播放动画,可参考:pycharm中动画函数animation.FuncAnimation不起作用

实例参考:

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
fig, ax = plt.subplots()
xdata, ydata = [], []
ln, = plt.plot([], [], 'ro')
def init():
    ax.set_xlim(0, 2*np.pi)
    ax.set_ylim(-1, 1)
    return ln,
def update(frame):
    xdata.append(frame)
    ydata.append(np.sin(frame))
    ln.set_data(xdata, ydata)
    return ln,
ani = FuncAnimation(fig, update, frames=np.linspace(0, 2*np.pi, 128), init_func=init, blit=True)
plt.show()

输出:20210411133043658.gif


六、参考文章


参考文章1

参考文章2

参考文章3

参考文章4

参考文章5

参考文章6

参考文章7


七、Blogger’s speech


如有不足,还请大佬评论区留言或私信我,我会进行补充。

感谢您的支持,希望可以点赞,关注,收藏,一键三连哟。

相关文章
|
2天前
|
算法 数据挖掘 数据处理
搜索新境界:Python二分查找变种实战,精准定位数据不是梦!
【7月更文挑战第13天】二分查找算法以O(log n)效率在有序数组中查找数据。基础算法通过不断分割数组对比中间元素。Python实现变种包括:1) 查找目标值的第一个出现位置,找到后向左搜索;2) 查找目标值的最后一个出现位置,找到后向右搜索。这些变种在数据分析和索引构建等场景中极具价值,提升处理效率。
|
3天前
|
存储 算法 搜索推荐
算法进阶之路:Python 归并排序深度剖析,让数据排序变得艺术起来!
【7月更文挑战第12天】归并排序是高效稳定的排序算法,采用分治策略。Python 实现包括递归地分割数组及合并已排序部分。示例代码展示了如何将 `[12, 11, 13, 5, 6]` 分割并归并成有序数组 `[5, 6, 11, 12, 13]`。虽然 $O(n log n)$ 时间复杂度优秀,但需额外空间,适合大规模数据排序。对于小规模数据,可考虑其他算法。**
18 4
|
3天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
【7月更文挑战第12天】Python的Pandas和NumPy库助力高效数据处理。Pandas用于数据清洗,如填充缺失值和转换类型;NumPy则擅长数组运算,如元素级加法和矩阵乘法。结合两者,可做复杂数据分析和特征工程,如产品平均销售额计算及销售额标准化。Pandas的时间序列功能,如移动平均计算,进一步增强分析能力。掌握这两者高级技巧,能提升数据分析质量和效率。
17 4
|
2天前
|
数据格式 Python
Python代码示例,读取excel表格,将行数据转为列数据。(10)
【7月更文挑战第10天】Python代码示例,读取excel表格,将行数据转为列数据。
17 2
|
4天前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
微软在 UserVoice 上运营着⼀个反馈论坛,每个⼈都可以在这⾥提交新点⼦供他⼈投票。票数最⾼的功能请求是“将 Python 作为Excel 的⼀门脚本语⾔”,其得票数差不多是第⼆名的两倍。尽管⾃2015 年这个点⼦发布以来并没有什么实质性进展,但在 2020 年年末,Python 之⽗ Guido van Rossum 发布推⽂称“退休太无聊了”,他将会加入微软。此事令 Excel ⽤户重燃希望。我不知道他的举动是否影响了 Excel 和 Python 的集成,但我清楚的是,为何⼈们迫切需要结合 Excel 和 Python 的⼒量,⽽你⼜应当如何从今天开始将两者结合起来。总之,这就是本
|
1天前
|
数据采集 数据挖掘 数据处理
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
【7月更文挑战第14天】Python的Pandas和NumPy库是数据分析的核心工具。Pandas以其高效的数据处理能力,如分组操作和自定义函数应用,简化了数据清洗和转换。NumPy则以其多维数组和广播机制实现快速数值计算。两者协同工作,如在DataFrame与NumPy数组间转换进行预处理,提升了数据分析的效率和精度。掌握这两者的高级功能是提升数据科学技能的关键。**
7 0
|
2天前
|
数据可视化 Python
时间序列分析是一种统计方法,用于分析随时间变化的数据序列。在金融、经济学、气象学等领域,时间序列分析被广泛用于预测未来趋势、检测异常值、理解周期性模式等。在Python中,`statsmodels`模块是一个强大的工具,用于执行各种时间序列分析任务。
时间序列分析是一种统计方法,用于分析随时间变化的数据序列。在金融、经济学、气象学等领域,时间序列分析被广泛用于预测未来趋势、检测异常值、理解周期性模式等。在Python中,`statsmodels`模块是一个强大的工具,用于执行各种时间序列分析任务。
7 0
|
2天前
|
机器学习/深度学习 PyTorch TensorFlow
在深度学习中,数据增强是一种常用的技术,用于通过增加训练数据的多样性来提高模型的泛化能力。`albumentations`是一个强大的Python库,用于图像增强,支持多种图像变换操作,并且可以与深度学习框架(如PyTorch、TensorFlow等)无缝集成。
在深度学习中,数据增强是一种常用的技术,用于通过增加训练数据的多样性来提高模型的泛化能力。`albumentations`是一个强大的Python库,用于图像增强,支持多种图像变换操作,并且可以与深度学习框架(如PyTorch、TensorFlow等)无缝集成。
8 0
|
2天前
|
数据可视化 Linux 数据格式
`seaborn`是一个基于`matplotlib`的Python数据可视化库,它提供了更高级别的接口来绘制有吸引力的和信息丰富的统计图形。`seaborn`的设计目标是使默认图形具有吸引力,同时允许用户通过调整绘图参数来定制图形。
`seaborn`是一个基于`matplotlib`的Python数据可视化库,它提供了更高级别的接口来绘制有吸引力的和信息丰富的统计图形。`seaborn`的设计目标是使默认图形具有吸引力,同时允许用户通过调整绘图参数来定制图形。
5 0
|
2天前
|
Python
`matplotlib`是Python中一个非常流行的绘图库,它提供了丰富的绘图接口,包括二维和三维图形的绘制。`Axes3D`是`matplotlib`中用于创建三维坐标轴的对象,而`plot_surface`则是用于在三维空间中绘制表面的函数。
`matplotlib`是Python中一个非常流行的绘图库,它提供了丰富的绘图接口,包括二维和三维图形的绘制。`Axes3D`是`matplotlib`中用于创建三维坐标轴的对象,而`plot_surface`则是用于在三维空间中绘制表面的函数。
11 0