【100天精通Python】Day68:Python可视化_Matplotlib 绘制热力图,示例+代码

简介: 【100天精通Python】Day68:Python可视化_Matplotlib 绘制热力图,示例+代码

       Matplotlib 是一个Python数据可视化库,它提供了各种绘图工具和函数,用于创建多种类型的图表,包括热力图(Heatmap)。热力图是一种用颜色来表示数据值的分布和模式的可视化方式,通常用于研究数据的相关性、密度、趋势等。


1 Matplotlib绘制热力图步骤

导入库

在开始之前,需要导入必要的库,包括Matplotlib和NumPy。NumPy通常用于生成或处理数据。

import numpy as np
import matplotlib.pyplot as plt
  1. 准备数据
    在绘制热力图之前,需要准备数据。数据可以是二维数组或矩阵,其中每个元素表示某个位置的数值。
    data = np.random.rand(10, 10) # 示例数据,可以根据需求替换为你的数据
  2. 创建热力图

使用Matplotlib的imshow函数来创建热力图。你可以指定颜色映射(colormap),以及其他可选的参数,如图例、坐标轴标签等。

​plt.imshow(data, cmap='viridis')  # 使用'viridis'颜色映射,可以根据需求选择其他颜色映射
plt.colorbar()  # 添加颜色条
plt.title('Heatmap Example')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
  1. 4 显示热力图

          使用plt.show()函数来显示生成的热力图。

       这些步骤将生成一个基本的热力图,其中颜色表示数据值的大小和密度。你可以根据需要自定义图表的外观,例如调整颜色映射、添加注释、更改标签等

       此外,Matplotlib还提供了其他绘制热力图的方法,例如pcolormesh和imshow之外,你还可以使用heatmap等其他方法,以适应不同类型的数据和需求。


2 常用热力图类型

       值热力图(Value Heatmap):用不同的颜色和亮度表示数值的大小和密度。较高的数值通常以鲜艳和明亮的颜色表示,而较低的数值则以暗淡的颜色表示。

       密度热力图(Density Heatmap):用颜色强度表示数据点的集中程度和分布密度。较高的密度区域会显示为较深的颜色,较低的密度区域则显示为较浅的颜色。

       时间热力图(Time Heatmap):将时间作为一个维度,用颜色的强度表示特定时间段内的某种事件或指标的变化趋势。较高的值通常以深色显示,较低的值则以浅色显示。

       空间热力图(Spatial Heatmap):用颜色强度表示地理区域内的数据分布情况。可以按地理位置和对应的数值来绘制颜色强度的差异。

       渐变热力图(Gradient Heatmap):通过平滑过渡的颜色渐变来表示数值或密度的变化程度。使用渐变热力图可以更好地展示数据的变化趋势和分布情况。  


3 值热力图(Value Heatmap):

       值热力图通常用于表示数值大小和密度。较高的数值使用鲜艳的颜色,而较低的数值使用暗淡的颜色。

import numpy as np
import matplotlib.pyplot as plt
# 创建示例数据
data = np.random.rand(10, 10)  # 生成一个10x10的随机数据矩阵
# 创建值热力图
plt.imshow(data, cmap='YlOrRd', aspect='auto')  # 使用YlOrRd颜色映射
plt.colorbar()  # 添加颜色条
plt.title('Value Heatmap Example')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
plt.show()

在这个示例中,我们执行了以下步骤:

  1. 导入必要的库,包括 NumPy 和 Matplotlib。
  2. 创建一个随机的 10x10 数据矩阵,你可以用自己的数据替代这个示例数据。
  3. 使用 imshow 函数来显示值热力图。参数 cmap 用于选择颜色映射,这里使用了 'YlOrRd' 颜色映射,但你可以根据需要选择其他颜色映射。aspect='auto' 参数用于自动调整图像的纵横比以适应数据。
  4. 使用 colorbar() 函数添加颜色条,以便查看颜色与数值之间的对应关系。
  5. 添加标题、坐标轴标签等可选的图形元素。
  6. 最后,使用 show() 函数来显示热力图。

4 密度热力图(Density Heatmap)

通常用来表示数据点的集中程度和分布密度,较高的密度区域会显示为较深的颜色,而较低的密度区域则显示为较浅的颜色。以下是一个使用 Matplotlib 创建密度热力图的示例和代码:

import numpy as np
import matplotlib.pyplot as plt
# 创建示例数据
x = np.random.randn(1000)  # 随机生成1000个数据点
y = np.random.randn(1000)
# 创建密度热力图
plt.hist2d(x, y, bins=(50, 50), cmap='Blues')
plt.colorbar()  # 添加颜色条
plt.title('Density Heatmap Example')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
plt.show()

在这个示例中,我们执行了以下步骤:

  1. 导入必要的库,包括 NumPy 和 Matplotlib。
  2. 创建两个随机数据数组 xy,这些数据点将用于创建密度热力图。
  3. 使用 hist2d 函数来创建密度热力图。参数 xy 是数据点的坐标,bins 参数用于指定在 x 和 y 方向上的直方图箱的数量。颜色映射使用 'Blues',你可以选择其他颜色映射。
  4. 使用 colorbar() 函数添加颜色条,以便查看颜色与密度之间的对应关系。
  5. 添加标题、坐标轴标签等可选的图形元素。
  6. 最后,使用 show() 函数来显示密度热力图。

5 时间热力图(Time Heatmap):

时间热力图将时间作为一个维度,用颜色的强度表示特定时间段内的某种事件或指标的变化趋势。

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# 创建示例数据
date_rng = pd.date_range(start='2023-01-01', end='2023-12-31', freq='D')
data = np.random.rand(len(date_rng), 24)  # 每天24小时的随机数据
# 创建时间热力图
plt.imshow(data, cmap='YlGnBu', aspect='auto')
plt.colorbar()  # 添加颜色条
plt.title('Time Heatmap Example')
plt.xlabel('Hour of the Day')
plt.ylabel('Date')
plt.show()

6 空间热力图(Spatial Heatmap)

通常用于表示地理区域内的数据分布情况,其中颜色的强度表示数据的集中程度。

在这里,展示如何使用 Matplotlib 创建一个基本的空间热力图示例,其中我们将使用随机生成的地理坐标和值来演示。

import numpy as np
import matplotlib.pyplot as plt
# 创建示例数据
np.random.seed(0)  # 设置随机种子以确保结果可重复
num_points = 100  # 生成100个数据点
latitude = np.random.uniform(37.0, 42.0, num_points)  # 随机生成纬度坐标
longitude = np.random.uniform(-120.0, -115.0, num_points)  # 随机生成经度坐标
values = np.random.uniform(0, 1, num_points)  # 为每个点生成随机值
# 创建空间热力图
plt.scatter(longitude, latitude, c=values, cmap='viridis', s=100)
plt.colorbar(label='Value')
plt.title('Spatial Heatmap Example')
plt.xlabel('Longitude')
plt.ylabel('Latitude')
plt.show()

在这个示例中,我们执行了以下步骤:

  1. 我们使用 NumPy 生成了100个随机的地理坐标点,包括纬度(latitude)和经度(longitude)坐标。
  2. 对于每个点,我们生成了一个随机的值(在0到1之间),这将用于表示数据点的强度。
  3. 使用 plt.scatter 函数绘制散点图,其中 c 参数表示颜色,我们使用 'viridis' 颜色映射来表示数据值的不同强度。
  4. 我们添加了颜色条(colorbar)以解释颜色与数值之间的关系。
  5. 添加标题和坐标轴标签以增强图形的可读性。

7 渐变热力图(Gradient Heatmap)

       渐变热力图(Gradient Heatmap)用平滑的颜色过渡来表示数值或密度的变化程度。

       以下是使用 Matplotlib 创建一个简单的渐变热力图示例,其中我们将使用 NumPy 生成一个二维的数值数据并将其可视化。

import numpy as np
import matplotlib.pyplot as plt
# 创建示例数据
x = np.linspace(0, 10, 100)
y = np.linspace(0, 10, 100)
X, Y = np.meshgrid(x, y)
Z = np.sin(X) + np.cos(Y)  # 这里使用一个简单的二维函数作为示例数据
# 创建渐变热力图
plt.contourf(X, Y, Z, cmap='coolwarm', levels=20)
plt.colorbar(label='Value')
plt.title('Gradient Heatmap Example')
plt.xlabel('X')
plt.ylabel('Y')
plt.show()

在这个示例中,我们执行了以下步骤:

  1. 使用 NumPy 创建了一个网格点 (X, Y),其中 XY 分别是 xy 值的网格。
  2. 我们定义了一个简单的二维函数 Z,在这个示例中,我们使用了 sin(X) + cos(Y) 作为示例函数。
  3. 使用 plt.contourf 函数创建渐变热力图。我们使用 'coolwarm' 颜色映射来表示数值变化,levels 参数指定了渐变的级别数量。
  4. 我们添加了颜色条以解释颜色与数值之间的关系。
  5. 添加了标题和坐标轴标签以提高图形的可读性。

这个示例生成了一个渐变热力图,其中颜色的渐变表示数值的变化程度。你可以将示例数据替换为你自己的二维数据,以生成符合你需求的渐变热力图。


8 3D热力图

       通常使用密度分布来表示数据的三维分布。以下是一个使用Matplotlib创建3D密度热力图的示例,其中我们将使用NumPy生成数据并可视化它:

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
# 创建示例数据
np.random.seed(0)
x = np.random.randn(1000)
y = np.random.randn(1000)
# 创建3D图形
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
# 创建3D密度热力图
hist, xedges, yedges = np.histogram2d(x, y, bins=40)
xpos, ypos = np.meshgrid(xedges[:-1] + 0.25, yedges[:-1] + 0.25, indexing="ij")
xpos = xpos.ravel()
ypos = ypos.ravel()
zpos = 0
dx = dy = 0.5
dz = hist.ravel()
ax.bar3d(xpos, ypos, zpos, dx, dy, dz, cmap='viridis')
# 设置坐标轴标签
ax.set_xlabel('X')
ax.set_ylabel('Y')
ax.set_zlabel('Density')
# 显示图形
plt.show()

在这个示例中,我们执行了以下步骤:

  1. 我们使用NumPy生成了两个随机数据数组xy,共1000个数据点,这些数据点将用于创建3D密度热力图。
  2. 创建了一个包含3D子图的图形fig
  3. 使用histogram2d函数生成xy的二维直方图,将数据点分成40个箱子。
  4. 使用bar3d函数在3D子图中绘制3D密度热力图。我们使用'viridis'颜色映射来表示密度的变化。
  5. 设置了坐标轴标签。
  6. 最后,使用plt.show()函数来显示3D密度热力图。

这个示例生成了一个3D密度热力图,其中颜色深度表示数据点的密度分布。你可以将示例数据替换为自己的数据,以生成符合你需求的3D密度热力图。

目录
相关文章
|
2天前
|
数据可视化 数据挖掘 Python
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化(下)
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化
|
2天前
|
数据可视化 API 开发者
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化(上)
Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化
12 0
|
2天前
|
机器学习/深度学习 数据可视化 安全
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化(下)
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化
11 1
|
2天前
|
机器学习/深度学习 数据可视化 Python
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化(上)
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化
16 0
|
2天前
|
机器学习/深度学习 算法 数据可视化
Python用KNN(K-近邻)回归、分类、异常值检测预测房价、最优K值选取、误差评估可视化
Python用KNN(K-近邻)回归、分类、异常值检测预测房价、最优K值选取、误差评估可视化
|
2天前
|
自然语言处理 数据可视化 数据挖掘
数据代码分享|Python对全球Covid-19疫情失业数据相关性、可视化分析
数据代码分享|Python对全球Covid-19疫情失业数据相关性、可视化分析
|
2天前
|
资源调度 数据可视化 Python
Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数时间数据波动性可视化
Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数时间数据波动性可视化
|
2天前
|
数据可视化 数据挖掘 TensorFlow
Python贝叶斯高斯混合模型GMM聚类分析数据和混合密度可视化
Python贝叶斯高斯混合模型GMM聚类分析数据和混合密度可视化
|
2天前
|
机器学习/深度学习 数据可视化 TensorFlow
Python用线性回归和TensorFlow非线性概率神经网络不同激活函数分析可视化
Python用线性回归和TensorFlow非线性概率神经网络不同激活函数分析可视化
|
2天前
|
机器学习/深度学习 PyTorch 算法框架/工具
Python用GAN生成对抗性神经网络判别模型拟合多维数组、分类识别手写数字图像可视化
Python用GAN生成对抗性神经网络判别模型拟合多维数组、分类识别手写数字图像可视化