20. Matplotlib 数据可视化(下)

简介: 20. Matplotlib 数据可视化

20. Matplotlib 数据可视(上):https://developer.aliyun.com/article/1529105

2.5 散点图

散点图是由独立的恶点、圆圈或其它形状构成的。

使用plt.plot/ax.plot画散点图。

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
plt.style.use('seaborn-whitegrid')
x = np.linspace(0,10,30)
y = np.sin(x)
plt.plot(x,y,'o',color='black')
rng = np.random.RandomState(0)
for marker in ['o','.',',','x','+','v','^','<','>','s','d']:
    plt.plot(rng.rand(5),rng.rand(5),marker,label="marker='{0}'".format(marker))
    plt.legend(numpoints=1)
    plt.xlim(0,1.8)

plt.plot(x,y,'-ok') # 直线(-)、圆圈(o)、黑色(k)

plt.plot(x,y,'-p',color='gray',markersize=15,linewidth=4,
         markerfacecolor='white',
         markeredgecolor='gray',
         markeredgewidth=2)
plt.ylim(-1.2,1.2)

plt.scatter函数画散点图。

plt.scatter与plt.plot的主要区别:前者在创建散点图时具有更高的灵活性,可以单独控制每个散点图与数据匹配,也可以让每个散点图具有不同的属性(大小、表面颜色、边框颜色等)

rng = np.random.RandomState(0)
x = rng.randn(100)
y = rng.randn(100)
colors = rng.rand(100)
sizes = 1000*rng.rand(100)
plt.scatter(x,y,c=colors,s=sizes,alpha=0.3,cmap='viridis')
plt.colorbar()

from sklearn.datasets import load_iris
iris = load_iris()
features = iris.data.T
plt.scatter(features[0],features[1],alpha=0.2,
            s=100*features[3],c=iris.target,cmap='viridis')
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[1])

数据量较小的时候,plt.plot与plt.scatter在效率上差异不大,但是当数据大的时候,plt.plot的效率将大大高于plt.scatter。

2.6 等高线图

使用plt.contour可以画等高线图,可以画带有填充色的等高线图的色彩,使用plt.imshow可以显示图形。

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
plt.style.use('seaborn-white')
def f(x,y):
    return np.sin(x)**10+np.cos(10+y*x)*np.cos(x)
x = np.linspace(0,5,50) # 0~5中50个等差数字
y = np.linspace(0,5,40)
X,Y = np.meshgrid(x,y) # 从一维数组构建二维网格数据
Z = f(X,Y)
# plt.contour(X,Y,Z,colors='black') # 画标准的线形等高线图
plt.contour(X,Y,Z,20,cmap='RdGy') # 设置一个线条配色方案自定义颜色,将数据范围等分为20份;红-灰
plt.colorbar() # 自动创建一个表示图形各种颜色对应的标签颜色条

contours = plt.contour(X,Y,Z,3,colors='black')
plt.clabel(contours,inline=True,fontsize=8)
plt.imshow(Z,extent=[0,5,0,5],origin='lower',cmap='RdGy',alpha=0.5)# alpha 设置透明度
plt.colorbar()

2.7 直方图

一维直方图:创建一个简易的频次直方图

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
plt.style.use('seaborn-white')

# data = np.random.randn(1000)
# plt.hist(data,bins=30,density=True,alpha=0.5,
#          histtype='stepfilled',color='steelblue',
#          edgecolor='none')

x1 = np.random.normal(0,0.8,1000)
x2 = np.random.normal(-2,1,1000)
x3 = np.random.normal(3,2,1000)
kwargs = dict(histtype='stepfilled',alpha=0.3,density=True,bins=40)
plt.hist(x1,**kwargs)
plt.hist(x2,**kwargs)
plt.hist(x3,**kwargs)
print(counts) # 查看每段区间样本数 [ 16 249 565 165   5]

二维直方图:将二维数组按照二维区间进行切分创建二维频次直方图。

使用plt.hist2d

mean = [0,0]
cov = [[1,1],[1,2]]
x,y = np.random.multivariate_normal(mean,cov,10000).T
plt.hist2d(x,y,bins=30,cmap='Blues')
cb = plt.colorbar()
cb.set_label('counts in bin')
counts,xedges,yedges = np.histogram2d(x,y,bins=30)

使用plt.hexbin,正六边形分割,将二维数据集成分割成蜂窝状

plt.hexbin(x,y,gridsize=30,cmap='Blues')
cb = plt.colorbar(label='count in bin')

核密度估计:使用KDE方法抹除空间中离散的数据点,从而拟合一个平滑的函数。

from scipy.stats import gaussian_kde
data = np.vstack([x,y])
kde = gaussian_kde(data)
xgrid = np.linspace(-3.5,3.5,40)
ygrid = np.linspace(-6,6,40)
Xgrid,Ygrid = np.meshgrid(xgrid,ygrid)
Z = kde.evaluate(np.vstack([Xgrid.ravel(),Ygrid.ravel()]))
plt.imshow(Z.reshape(Xgrid.shape),origin='lower',
           aspect='auto',extent=[-3.5,3.5,-6,6],cmap='Blues')
cb = plt.colorbar(label='density')

KDE 方法通过不同的平滑带宽长度在拟合函数的准确性和平滑性之间做出权衡。gaussian_kde通过一种经验方法试图找到输入数据平滑长度的近似最优解。

相关文章
|
1月前
|
数据可视化 数据挖掘 API
数据可视化秘籍:用Matplotlib和Seaborn创建洞察力图表
【4月更文挑战第12天】本文介绍了Python中的数据可视化库Matplotlib和Seaborn,它们是数据分析中的强大工具。Matplotlib是基础绘图库,提供面向对象的API,可绘制多种图表。Seaborn基于Matplotlib,提供更美观和易用的界面,支持复杂的数据可视化技术。文中展示了如何使用这两个库创建线图、散点图、条形图、饼图和直方图,以帮助理解数据并展示发现。
|
1月前
|
机器学习/深度学习 数据可视化 数据处理
Python数据可视化:探索Matplotlib库的强大功能
本文将深入探讨Python中用于数据可视化的重要工具之一——Matplotlib库。通过介绍Matplotlib库的基本概念、常用功能和实际应用案例,帮助读者更好地了解如何利用Matplotlib创建各种吸引人的数据图表。
|
1月前
|
数据可视化 数据挖掘 数据处理
Python数据可视化库Matplotlib介绍与实践
本文深入介绍了Python中常用的数据可视化库Matplotlib,包括其基本概念、核心功能和实际运用。通过详细的示例和解释,帮助读者更好地理解Matplotlib的用法和优势,为数据分析和可视化提供技术支持。
|
16天前
|
数据可视化 Linux API
利用Matplotlib和Seaborn进行数据可视化与探索性分析
本文探讨了Python中数据可视化的关键工具——Matplotlib和Seaborn。Matplotlib是基础绘图库,可用于创建折线图,通过自定义参数实现图表美化。Seaborn是建立在Matplotlib之上的库,专注于统计图形,提供箱线图、散点图等,并有内置数据集便于学习。通过案例展示了如何利用这两个库分析销售数据,包括散点图、分布图和类别对比图,以助于数据探索和理解。
20 6
|
15天前
|
数据可视化 Python Windows
使用Python进行数据可视化(一、matplotlib)
使用Python进行数据可视化(一、matplotlib)
|
20天前
|
数据可视化 Python
利用Matplotlib绘制数据可视化图表
**摘要:** 本文介绍了Python的绘图库Matplotlib在数据分析和科学计算中的重要性。Matplotlib是一个开源库,提供类似MATLAB的接口,支持静态、动态和交互式图表的绘制,并能保存为多种格式。文章详细讲解了Matplotlib的基本用法,包括安装库、导入模块和绘制简单折线图的步骤。还展示了如何绘制柱状图并添加数据标签。通过这些例子,读者可以了解如何利用Matplotlib进行数据可视化,并对其进行自定义以满足特定需求。
24 4
|
19天前
|
数据可视化 数据挖掘 大数据
Python中的数据可视化库Matplotlib及其应用
数据可视化是数据分析过程中至关重要的一环,而Matplotlib作为Python中最流行的数据可视化库之一,为用户提供了丰富的绘图工具和定制选项。本文将介绍Matplotlib的基本用法和常见应用,帮助读者更好地利用这一强大工具进行数据呈现和分析。
|
6天前
|
数据可视化 数据挖掘 API
Python数据可视化基础:使用Matplotlib绘制图表
Python的Matplotlib是数据可视化的首选库,它提供静态、动态和交互式图表。要开始,先通过`pip install matplotlib`安装。绘制基本折线图涉及导入`pyplot`,设定数据,然后用`plot()`函数画图,如: ```markdown import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 3, 5, 7, 11] plt.plot(x, y, &#39;o&#39;) plt.show() ``` 自定义图表包括更改线条样式、颜色等,例如: ```markdown
|
18天前
|
人工智能 数据可视化 开发者
|
1月前
|
数据可视化 BI 索引
【Python】—— matplotlib数据可视化
【Python】—— matplotlib数据可视化
28 1