三、Matplotlib
1.数据可视化入门
在数据分析与机器学习中,我们经常要用到大量的可视化操作。一张制作精美的数据图片,可以展示大量的信息,一图顶千言。
而在可视化中,Matplotlib算得上是最常用的工具。Matplotlib 是 python 最著名的绘图库,它提供了一整套 API,十分适合绘制图表,或修改图表的一些属性,如字体、标签、范围等。
Matplotlib 是一个 Python 的 2D 绘图库,它交互式环境生成出版质量级别的图形。通过 Matplotlib这个标准类库,开发者只需要几行代码就可以实现生成绘图,折线图、散点图、柱状图、饼图、直方图、组合图等数据分析可视化图表。
设置清华源安装模块:
比如如果我们要安装:Matplotlib,注:你已安装matplotlib,这里只是已安装matplotlib为例介绍清华源,我们的常规下载方式就是在命令行中输入:pip install matplotlib
,这样你就可以从官方进行下载,但是这样的下载速度是十分的慢的,我们在本篇博客最开头曾说过,可以在pip install matplotlib
后加上-i https://pypi.tuna.tsinghua.edu.cn/simple
,这样就是从清华的地址处下载,下载速度会快很多,如果我们每次下载一个新的模块都要加上 -i https://pypi.tuna.tsinghua.edu.cn/simple
,确实是一个麻烦的大工程,那么有没有一劳永逸的方法呢?即如何指定是从清华大学下载呢?
我们 找到 C盘,找见我们的用户,点进用户名,然后创建一个 pip 文件夹:
然后打开下载好的压缩包,找到 pip.ini 文件
下载压缩包:
链接:https://pan.baidu.com/s/1y32LXxZ9Yx8GOn6YYlvwfw
提取码:6sl5
把这个文件拖入到刚建立好的 pip 文件夹中:
这样,我们就配置好了下载地址,我们可以直接输入 pip install matplotlib
,默认安装的网址就是清华大学的网址,就省去了写-i https://pypi.tuna.tsinghua.edu.cn/simple
1.1 基础知识
1.1.1 图形绘制
🚩数据可视化其实就是把抽象不容易看出规律的数据转换为人眼更能接受的图片,下面我们来简单的绘制一个图形
import numpy as np import matplotlib.pyplot as plt # 横坐标 # 等差数列,把[0,2π]等分成100份 x = np.linspace(0, 2 * np.pi, 100) # 纵坐标:正弦波; x:Numpy数组 y = np.sin(x) # 画线形图 plt.plot(x, y)
接下来我们对这个图进行简单的参数设置:
# 设置横坐标的范围是 -1 ~ 10 plt.xlim(-1, 10) # 设置纵坐标的范围是 -1.5 ~ 1.5 plt.ylim(-1.5, 1.5) # 设置网格线,网格线颜色设为绿色,透明度为0.5,线的样式为虚线:--,宽度为2 plt.grid(color = 'green', alpha = 0.5, linestyle = '--', linewidth = 2) plt.plot(x, y)