python数据分析之Matplotlib学习笔记

简介: 简介:这一篇是关于数分三剑客之一–matplotlib的一些学习笔记。

前言


这一篇是关于数分三剑客之一–matplotlib的一些学习笔记。

它的功能非常强大,可以让枯燥的数据“美腻”起来,那么先来看一下官方给的一些样图:

官方提供的各种各样的样图


一、基本组成


1、Figure

说到绘图,那必须要有一个画板。Figure作为一个“老画板”,在matlab中经常能看到它的出没,在python中,它的具体语法是什么呢?让我们来看一下。

figure(num, figsize, dpi, facecolor, edgecolor, frameon)
  • 六个参数的含义:

num:画板的编号;

figsize:指定画板的长和高;

dpi:绘图对象的参数;

facecolor:背景颜色;

edgecolor:边框颜色;

frameon:是否需要显示边框;

2、Axes

数学图形怎么能离开坐标轴呢?

创建的方法不一、这里利用set函数创建坐标轴。

  • set的五个参数含义:

xlim:x轴的范围 [min,max];

ylim:y轴的范围 [min,max];

xlable:自定义x轴的名称;

ylable:自定义y轴的名称;

title:自定义标题;

如:

import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], xlabel='X', ylabel='Y', title='first-try')
plt.show()

输出:(这里的樱花树,是pycharm的背景,不是代码实现的效果)image.png看了上例,ax = fig.add_subplot(111)的作用是啥呀?

其实,这部分和matlab中的subplot作用一样,就是在一个打的区域,布置“几个”(可以是1个)画板。

这里面的三个数字可以这么理解:第一个数字代表几行,第二个数字代表几列,第三个数字代表第几个(顺序是自左向右,自上到下)


如:

import matplotlib.pyplot as plt
fig = plt.figure()
ax1 = fig.add_subplot(221)
ax2 = fig.add_subplot(222)
ax3 = fig.add_subplot(224)
plt.show()

输出:image.png


二、常见图表的绘制


  • 开始之前,可以看一下大佬的这篇文章,介绍了很详细的参数值:

matplotlib绘图中与颜色相关的参数(color颜色参数、linestyle线型参数、marker标记参数)可选列表集合

1、折线图

使用plt.plot

import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5, 6]
y = [1, 3, 2, 5, 9, 2]
# 传进去x,y的坐标
plt.plot(x, y)  
plt.show()  

输出:image.png

2、柱形图

使用plt.bar

import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5, 6]
y = [1, 3, 2, 5, 9, 2]
# 传进去x,y的坐标
plt.bar(x, y, color='blue')
plt.show()

输出:image.png

3、饼图

使用plt.pie

import matplotlib.pyplot as plt
name = ['one', 'two', 'three', 'four', 'five', 'six']
x = [1, 3, 2, 5, 9, 2]
plt.pie(x, labels=name, colors=['b', 'r', 'g', 'k', 'c', 'm'])
plt.axis('equal')
plt.show()

输出:image.png

4、散点图

使用plt.scatter

import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5, 6]
y = [1, 3, 2, 5, 9, 2]
# market的作用是用什么记号来标记点
plt.scatter(x, y, color='red', marker='*')
plt.show()

输出:image.png

5、泡泡图

在处理随机数的时候,感觉挺有意思的。

import matplotlib.pyplot as plt
import numpy as np
plt.figure(figsize=(8, 8))
x = np.random.rand(50)
y = np.random.rand(50)
z = np.random.rand(50)
# color代表颜色,alpha代表透明度
plt.scatter(x, y, s=z * 1000, color='b', alpha=0.5)
plt.show()

输出:image.png


三、细节完善


1、坐标轴的完善(移动、“删除”)

对于坐标轴的改动,需要用到plt.gca函数,它有四个参数:top 、bottom、left、right。分别对应上下左右四个轴。如何操作,先看下面的例子。

  • 这个是上面我第一次尝试得到的结果图:image.png改善之后可变成这样(在画函数图像时应该更舒服一些):image.png代码:
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], title='first-try')
bx = plt.gca()
# 将下面的轴(x轴)设置为xaxis
bx.xaxis.set_ticks_position('bottom')
# 将设置后的轴移动到y=0的地方
bx.spines['bottom'].set_position(('data', 0))
bx.yaxis.set_ticks_position('left')
bx.spines['left'].set_position(('data', 0))
# 将不想看到的右、上方向的轴“删除”,其实就是把轴的颜色改为无色
bx.spines['top'].set_color('none')
bx.spines['right'].set_color('none')
plt.show()

2、刻度值的一些操作

  • ①调整刻度值的大小、颜色、显示情况
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], title='first-try')
# 对x、y轴的刻度值进行设置
plt.yticks(fontsize=20, color='#00000')  # y轴刻度值大小为20 ,颜色为黑色
# plt.yticks(fontsize=20, color='black')  # 用black也可以
plt.xticks([])  # [] ,即不显示x轴刻度值
plt.show()

输出:image.png对于颜色转换可以看一下这位大佬的总结:2020 RGB颜色查询大全 #000000 【颜色列表】

  • ②刻度值旋转
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set(xlim=[-2.5, 2.5], ylim=[-2.5, 2.5], title='first-try')
fig.autofmt_xdate()  # 默认旋转45°,可以在括号里加rotation=‘角度’
plt.show()

3、图例

import matplotlib.pyplot as plt
from numpy import *
x = linspace(0, 4, 50)  # linspace(A,B,C),指从A开始B结束,中间分布C个值,C默认为100
y1 = x
y2 = x**2
plt.figure()
l1, = plt.plot(x, y1, color='b', linestyle='-')
l2, = plt.plot(x, y2, color='r', linestyle='--')
# handles:需要制作图例的对象;labels:图例的名字;loc:图例的位置,loc的内容可选“best”,最佳位置
plt.legend(handles=[l1, l2], labels=['function1', 'function2'], loc='upper left')
plt.show()

注意:l1后面有个

输出:image.png

4、添加注释(如特殊点)

import matplotlib.pyplot as plt
from numpy import *
x = linspace(0, 4, 50)  # linspace(A,B,C),指从A开始B结束,中间分布C个值,C默认为100
y = x**2
plt.figure()
# 选取需要标注的点
x0 = 1.5
y0 = x0**2
# 作图
plt.plot(x, y)
# 作垂线,
plt.plot([x0, x0], [0, y0], 'k--', linewidth=1)
# 作出标注的点
plt.scatter([x0, ], [y0, ], s=50, color='b')
# 做标注
plt.annotate(r'$x^2=%s$' % y0, xy=(x0, y0), xycoords='data', xytext=(+30, -30),
             textcoords='offset points', fontsize=16,
             arrowprops=dict(arrowstyle='->', connectionstyle="arc3,rad=.2"))
# 参数xycoords='data' 是说基于数据的值来选位置,
# xytext=(+30, -30) 和 textcoords='offset points' 对于标注位置的描述 和 xy 偏差值
# arrowprops是对图中箭头类型的一些设置
plt.show()
  • arrowstyle的格式:
``'-'``        None
``'->'``       head_length=0.4,head_width=0.2
``'-['``       widthB=1.0,lengthB=0.2,angleB=None
``'|-|'``      widthA=1.0,widthB=1.0
``'-|>'``      head_length=0.4,head_width=0.2
``'<-'``       head_length=0.4,head_width=0.2
``'<->'``      head_length=0.4,head_width=0.2
``'<|-'``      head_length=0.4,head_width=0.2
``'<|-|>'``    head_length=0.4,head_width=0.2
``'fancy'``    head_length=0.4,head_width=0.4,tail_width=0.4
``'simple'``   head_length=0.5,head_width=0.5,tail_width=0.2
``'wedge'``    tail_width=0.3,shrink_factor=0.5

输出:image.png


四、图中图


import matplotlib.pyplot as plt
from numpy import *
x = linspace(0, 4, 50)  # linspace(A,B,C),指从A开始B结束,中间分布C个值,C默认为100
y = x**2
fig = plt.figure()
# 这四个数字分别代表的是相对figure的位置
left, bottom, width, height = 0.1, 0.1, 0.8, 0.8
ax1 = fig.add_axes([left, bottom, width, height])
ax1.plot(x, y, 'r')
ax1.set_xlabel('x')
ax1.set_ylabel('y')
ax1.set_title('main')
ax2 = fig.add_axes([0.2, 0.6, 0.25, 0.25])
ax2.plot(y, x, 'b')
ax2.set_xlabel('x')
ax2.set_ylabel('y')
ax2.set_title('children1')
ax3 = fig.add_axes([0.65, 0.2, 0.2, 0.2])
ax3.plot(y, x, 'b')
ax3.set_xlabel('x')
ax3.set_ylabel('y')
ax3.set_title('children2')
plt.show()

输出:image.png这里系统会有提示:This figure includes Axes that are not compatible with tight_layout, so results might be incorrect.

意思为:此图包括与紧固件布局不兼容的轴,因此结果可能不正确。


五、动画制图


前排提示:如果使用pycharm无法播放动画,可参考:pycharm中动画函数animation.FuncAnimation不起作用

实例参考:

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
fig, ax = plt.subplots()
xdata, ydata = [], []
ln, = plt.plot([], [], 'ro')
def init():
    ax.set_xlim(0, 2*np.pi)
    ax.set_ylim(-1, 1)
    return ln,
def update(frame):
    xdata.append(frame)
    ydata.append(np.sin(frame))
    ln.set_data(xdata, ydata)
    return ln,
ani = FuncAnimation(fig, update, frames=np.linspace(0, 2*np.pi, 128), init_func=init, blit=True)
plt.show()

输出:20210411133043658.gif


六、参考文章


参考文章1

参考文章2

参考文章3

参考文章4

参考文章5

参考文章6

参考文章7


七、Blogger’s speech


如有不足,还请大佬评论区留言或私信我,我会进行补充。

感谢您的支持,希望可以点赞,关注,收藏,一键三连哟。

相关文章
|
7天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
27 0
|
17天前
|
数据采集 JSON 数据处理
抓取和分析JSON数据:使用Python构建数据处理管道
在大数据时代,电商网站如亚马逊、京东等成为数据采集的重要来源。本文介绍如何使用Python结合代理IP、多线程等技术,高效、隐秘地抓取并处理电商网站的JSON数据。通过爬虫代理服务,模拟真实用户行为,提升抓取效率和稳定性。示例代码展示了如何抓取亚马逊商品信息并进行解析。
抓取和分析JSON数据:使用Python构建数据处理管道
|
2天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
9 2
|
1天前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
9 1
|
5天前
|
数据可视化 JavaScript 前端开发
Python中交互式Matplotlib图表
【10月更文挑战第20天】Matplotlib 是 Python 中最常用的绘图库之一,但默认生成的图表是静态的。通过结合 mpld3 库,可以轻松创建交互式图表,提升数据可视化效果。本文介绍了如何使用 mpld3 在 Python 中创建交互式散点图、折线图和直方图,并提供了详细的代码示例和安装方法。通过添加插件,可以实现缩放、平移和鼠标悬停显示数据标签等交互功能。希望本文能帮助读者掌握这一强大工具。
24 5
|
2天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
3天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
10天前
|
数据采集 数据可视化 数据处理
如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`)
本文介绍了如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`),加载历史数据,计算均线和其他技术指标,实现交易逻辑,记录和可视化交易结果。示例代码展示了如何根据均线交叉和价格条件进行开仓、止损和止盈操作。实际应用时需注意数据质量、交易成本和风险管理。
29 5
|
8天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
20 1
|
14天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
20 2