Matplotlib介绍
数据可视化是数据科学家需要掌握的必备技能之一。使用可视化技术可以理解和解决大多数业务问题。可视化主要包括探索性数据分析(EDA)和图形绘制。有效的可视化有助于用户了解数据中的模式,并有效地解决业务问题。可视化的另一个优点是能将复杂数据简化为易于理解的形式。
人们总是觉得图像比文本更容易理解,因此可视化是分析和解释数据的最佳手段,它能帮助用户轻松地理解大量的信息。数据可视化也有助于人们理解趋势、相关性、模式、分布等信息。
在数据可视化领域的众多工具和技术中,python是最常用的。Python为数据可视化提供了多个库,其中最常用的有:
- Matplotlib
- Seaborn
- Pandas visualisation
- Plotly
本文档将有助于你了解在业界被广泛使用的matplotlib库。Matplotlib具有丰富的图形功能,而且容易上手。本文主要介绍不同的图形功能,包括一些语法等。
Matplotlib的安装
matplotlib库有多种安装方法。最简单的安装matplotlib的方式是下载Anaconda包。因为Anaconda会默认安装Matplotlib,不需要你进行任何额外的步骤。
从anaconda的官方网站下载anaconda软件包
为了安装matplotlib,打开anaconda提示符并运行以下命令
pip install matplotlib
or
conda install matplotlib
在Jupyter notebook中运行以下命令以验证matplotlib是否正确安装
import matplotlibmatplotlib.__version__
请输入图片描述
如何使用Matplotlib
在使用matplotlib之前,我们需要在Jupyter notebook中使用‘import’方法来导入这个包。PyPlot是matplotlib中最常用的数据可视化模块,通常使用PyPlot就足以满足可视化的需求。
# import matplotlib library as mplimport matplotlib as mpl#import the pyplot module from matplotlib as plt (short name used for referring the object)import matplotlib.pyplot as plt
请输入图片描述
Matplotlib、Pyplot和Python之间的关系
Python是一种非常流行的编程语言,可以用于web开发、数学和统计分析。Python可以在大多数平台上工作,而且使用起来也很简单。
Python有很多库可以调用,用于可视化和数据分析的库主要以下几种。
NumPy
Pandas
Matplotlib
Seaborn
Plotly
SciKit-Learn
正如您所看到的,这里面包括matplotlib,它是使用python开发的。这个库被广泛用于数据可视化。
PyPlot是matplotlib中的一个模块,它提供类似于MATLAB的交互体验。MATLAB被广泛用于工业界中的统计分析。但MATLAB是一种需要许可的软件,且价格不菲。而PyPlot是一个开源模块,为python用户提供类似MATLAB的功能。总之,PyPlot在开源环境中被视为MATLAB的替代品。
绘制一个简单的图像
在这里,我们将使用NumPy生成的随机数来绘制一个简单的图像。创建图像最简单的方法是使用' plot() '方法。为了生成一个图像,我们需要两个坐标轴(X)和(Y),因此我们使用Numpy中的' linspace() '方法生成两个随机数列。
# import the NumPy package import numpy as np # generate random number using NumPy, generate two sets of random numbers and store in x, y x = np.linspace(0,50,100) y = x * np.linspace(100,150,100) # Create a basic plot plt.plot(x,y)
请输入图片描述
生成的图像如下图所示:
请输入图片描述
为图像添加更多元素
上面生成的图还缺少一些东西,让我们试着为它添加不同的元素,以便更好地解释这个图。可以为其添加的元素包括title、x-Label、y-label、x-limits、y-limits。
# set different elements to the plot generated above # Add title using ‘plt.title’ # Add x-label using ‘plt.xlabel’ # Add y-label using ‘plt.ylabel’ # set x-axis limits using ‘plt.xlim’ # set y-axis limits using ‘plt.ylim’ # Add legend using ‘plt.legend’
请输入图片描述
请输入图片描述
# add color, style, width to line element plt.plot(x, y, c = 'r', linestyle = '--', linewidth=2)
请输入图片描述
# add markers to the plot, marker has different elements i.e., style, color, size etc., plt.plot (x, y, marker='*', markersize=3, c=’g’)
请输入图片描述
# add grid using grid() method Plt.grid(True) # add legend and label plt.legend()
请输入图片描述
图像自定义:
色彩
b –蓝色
c –青色
g –绿色
k –黑色
m –洋红色
r –红色
w –白色
y –黄色
可以使用十六进制或RGB格式
线型
'-' :实线
'--':虚线
'-。':点划线
':'–虚线
标记样式
。–点标记
,–像素标记
v –三角形向下标记
^ –三角形向上标记
<–三角形左标记
>–三角形右标记
1 –三脚架下降标记
2 –三脚架向上标记
3 –三脚架左标记
4 –三脚架右标记
s –方形标记
p –五边形标记
–星形标记
其他配置属性
color or c
linestyle
linewidth
marker
markeredgewidth
markeredgecolor
markerfacecolor
markersize