本文介绍基于Python中的gdal
模块,对大量长时间序列的栅格遥感影像文件,绘制其每一个波段中、若干随机指定的像元的时间序列曲线图的方法。
在之前的文章Python中GDAL批量绘制多时相栅格遥感影像的像元时间序列曲线图(https://blog.csdn.net/zhebushibiaoshifu/article/details/128354151)中,我们就已经介绍过基于gdal
模块,对大量多时相栅格图像,批量绘制像元时间序列折线图的方法。不过当时文章中的需求,每1
个时相都对应着3
个不同的遥感影像文件,而每1
个遥感影像文件则都仅仅只有1
个波段;而在本文中,我们每1
景遥感影像都对应着2
个波段,我们最终绘制的多条曲线图,也都来自于这每1
景遥感影像的不同波段。
我们再来明确一下本文的需求。现在有一个文件夹,其中放置了大量的遥感影像文件,如下图所示。其中,所有遥感影像都是同一地区、不同成像时间的图像,其各自的空间参考信息、像元行数与列数等都是一致的,文件名中有表示成像日期的具体字段;且每1
景遥感影像都具有2
个波段。现在我们希望,在遥感影像覆盖的区域内,随机选取若干的像元,基于这些像元,我们绘制其随时间变化的曲线图。因为我们的每个遥感影像都有2
个波段,且都希望绘制出曲线图,因此最终的曲线图一共就有2
条曲线。
明确了需求,我们就可以开始代码的撰写。本文用到的代码如下。
# -*- coding: utf-8 -*- """ Created on Tue Jul 25 23:04:41 2023 @author: fkxxgis """ import os import random import matplotlib.pyplot as plt from osgeo import gdal def load_image(image_path): dataset = gdal.Open(image_path) band1 = dataset.GetRasterBand(1).ReadAsArray() band2 = dataset.GetRasterBand(2).ReadAsArray() del dataset return band1, band2 def plot_time_series(image_folder, pic_folder, num_pixels): image_files = [file for file in os.listdir(image_folder) if file.endswith(".tif")] band1_merge, band2_merge = [], [] i = 0 for image_file in image_files: image_path = os.path.join(image_folder, image_file) band1, band2 = load_image(image_path) band1_merge.append(band1) band2_merge.append(band2) i += 1 x_size, y_size = band1.shape pixel_indices = random.sample(range(x_size * y_size), num_pixels) for pixel_index in pixel_indices: x, y = divmod(pixel_index, y_size) band_list_1, band_list_2 = [], [] for i in range(len(band1_merge)): band_data_1 = band1_merge[i] band_list_1.append(band_data_1[x, y]) band_data_2 = band2_merge[i] band_list_2.append(band_data_2[x, y]) plt.figure() plt.plot(range(len(band1_merge)), band_list_1, label="Band 1") plt.plot(range(len(band1_merge)), band_list_2, label="Band 2") plt.xlabel("Time") plt.ylabel("NDVI") plt.ylim(0, 1000) plt.title(f"Time Series for Pixel at ({x}, {y})") plt.legend() plt.savefig(os.path.join(pic_folder, str(x) + "_" + str(y))) plt.show() image_folder_path = "E:/02_Project/Result/test" pic_folder_path = "E:/02_Project/TIFF/Plot" num_pixels = 50 plot_time_series(image_folder_path, pic_folder_path, num_pixels)
上述代码的具体含义如下。
首先,我们导入了需要使用的库;其中,os
用于处理文件路径和目录操作,random
用于随机选择像素,matplotlib.pyplot
则用于绘制图像。
随后,我们定义函数load_image(image_path)
;这个函数接收一个影像文件路径image_path
作为输入参数。随后,在函数内使用gdal
库打开该影像文件,然后提取其第一个和第二个波段的数据,并分别存储在band1
和band2
中。最后,函数返回这两个波段的数据。
接下来,我们定义函数plot_time_series(image_folder, pic_folder, num_pixels)
;这个函数接收三个输入参数,分别为image_folder
、pic_folder
和num_pixels
。其中,image_folder
为包含多个.tif
格式的影像文件的文件夹路径,pic_folder
是保存生成的时间序列图像的文件夹路径,而num_pixels
则指定了随机选择的像素数量,用于绘制时间序列图——这个参数设置为几,我们最后就会得到几张结果图像。
在这个函数的内部,我们通过os.listdir
函数获取image_folder
中所有以.tif
结尾的影像文件,并将这些文件名存储在image_files
列表中。然后,我们创建两个空列表band1_merge
和band2_merge
,用于存储所有影像文件的2
个波段数据。接下来,我们遍历所有影像文件,逐个加载每个影像文件的全部波段数据,并将它们添加到对应的列表中。其次,使用random.sample
函数从像素索引的范围中随机选择num_pixels
个像素的索引,并保存在pixel_indices
列表中。接下来,我们遍历并恢复pixel_indices
中的每个像素索引,计算该像素在每个影像中的每个波段的时间序列数据,并存储在band_list_1
、band_list_2
列表中。
随后,我们即可绘制两个时间序列图,分别表示2
个波段在不同影像日期上的数值。最后,我们将图像保存到指定的文件夹pic_folder
中,命名规则为x_y
,其中x
与y
分别代表像素的横、纵坐标。
执行上述代码,我们即可在指定的文件夹路径下看到我们生成的多张曲线图;如下图所示。
其中,每1
张图像都表示了我们2
个波段在这段时间内的数值走势;如下图所示。
至此,大功告成。
欢迎关注:疯狂学习GIS