Python基于已知的分幅条带号筛选出对应遥感影像文件的方法

简介: Python基于已知的分幅条带号筛选出对应遥感影像文件的方法

  本文介绍基于Python语言,结合已知研究区域中所覆盖的全部遥感影像分幅条带号,从大量的遥感影像文件中筛选落在这一研究区域中遥感影像文件的方法。

  首先,先来明确一下本文所需实现的需求。现已知一个研究区域(四川省),且已知覆盖这一研究区域所需的全部遥感影像的分幅条带号(这里就以Sentinel-2数据所采用的分幅规则为例来介绍),如下图所示。

  其中,矢量图层上的标签Label)就是所需的遥感影像的分幅条带号;且这一矢量要素的属性表中,有具体每一个分幅条带号的具体字段(如上图红色方框所示的那一列)。

  同时,我们还下载好了大量的遥感影像——这些遥感影像数量众多,既有位于这一研究区域内的遥感影像,同时还有位于研究区域外的。其中,这里所有的遥感影像都保存在一个大文件夹下,而这一大文件夹下还有多个子文件夹,具体遥感影像就存在于子文件夹中;如下图所示。

  其中,红色框内的文件夹即为前述“大文件夹”,紫色框内的每一个文件夹即为前述“子文件夹”。此外,每一个子文件夹的命名也是和遥感影像的分幅条带号对应的,比如43LCC这一个子文件夹就是保存了UTM编号为43的网格内的全部遥感影像。这里关于Sentinel-2遥感影像分幅条带号的介绍,如果大家有需要,可以参考哨兵2号Sentinel-2分幅条带介绍与MGRS网格矢量文件获取https://blog.csdn.net/zhebushibiaoshifu/article/details/128858277)这篇文章。

  同时,在每一个遥感影像文件文件名中,都有分幅条带号这一字段;例如,打开43LCC这一子文件夹,如下图所示。

  我们希望实现的,就是基于上图所示的研究区域内遥感影像的分幅条带号信息,在大量的遥感影像中筛选出这些分幅对应的遥感影像文件,并将其通过复制的方式放入到一个新的结果文件夹中。

  了解了具体需求,我们就可以开始代码的撰写。首先,本文所需的完整代码如下所示。

# -*- coding: utf-8 -*-
"""
Created on Fri Feb  3 18:33:11 2023
@author: fkxxgis
"""
import os
import xlrd
import shutil
xls_file = r"E:\02_Project\Sentinel.xls"
tif_path = r"G:\S2_CSI_LCC_product\LCC_10days_2020"
result_path = r"G:\Select"
book = xlrd.open_workbook(xls_file)
sh = book.sheet_by_index(0)
row_num = sh.nrows
for row in range(1, row_num):
    mgrs = sh.cell(row,6).value
    utm = mgrs[0:2]
    for root, dirs, files in os.walk(tif_path):
        for name in dirs:
            if name[0:2] == utm:
                for root_1, dirs_1, files_1 in os.walk(os.path.join(root, name)):
                    for name_1 in files_1:
                        if name_1.find(mgrs) != -1:
                            if not os.path.exists(os.path.join(result_path, mgrs)):
                                os.makedirs(os.path.join(result_path, mgrs))
                                print("Make " + mgrs + " path.")
                            shutil.copy(os.path.join(root, name, name_1), os.path.join(result_path, mgrs, name_1))

  其中,我们需要导入osxlrdshutil3Python库,分别实现系统文件遍历、Excel数据读取与研究区域内遥感影像数据的复制。其中,关于xlrd库的配置,如果大家是用的Anaconda环境,可以参考Anaconda环境Python中xlrd库的配置方法https://blog.csdn.net/zhebushibiaoshifu/article/details/128876456)这篇文章。此外,我们首先需要将本文开头提及的表示遥感影像数据分幅条带号的矢量文件的属性表导出(通过“System Toolboxes”→“Conversion Tools.tbx”→“Excel”→“Table To Excel”选项,如下图所示),保存为.xls格式的表格文件,从而方便我们后期代码对数据的读取。

  在代码中,xls_file表示我们将属性表导出后得到的.xls格式的表格文件,tif_path表示存放所有遥感影像的大文件夹,result_path则表示找到我们所需的结果遥感影像文件后,希望将其复制到的路径。

  随后,我们通过xlrd.open_workbook()函数打开.xls格式的表格文件,读取其中的数据并获取其行数row_num;接下来,我们即可对这一表格文件的单元格数据加以遍历,也就是代码中的第1for循环——我们从第2行开始(因为第1行是表头),读取每一行第7列的数据(也就是存放有遥感影像分幅条带号的那一列),从而依次获取所需的遥感影像条带号。

  接下来,由于遥感影像的分幅条带号的前两位,以及前述子文件夹名称的前两位,都是表示UTM编号的两位数字,因此我们通过utm = mgrs[0:2]这句代码,截取当前遥感影像分幅条带号的前两位,并通过os.walk()函数进行遍历,通过一个if判断语句找到大文件夹下对应的子文件夹;随后,在这一子文件夹中同样通过os.walk()函数,进行遥感影像文件的遍历——也就是代码中第2个、第3个、第4for循环所做的事情。

  接下来,针对遍历得到的子文件夹中每一个遥感影像文件,我们通过.find()函数找到所有满足这一分幅条带号的遥感影像文件,也就是代码中第5for循环与第2if判断语句的工作。找到符合当前分幅条带号的遥感影像文件后,我们即可开始将其复制到目标文件夹中。

  这里还有一个需求,因为我们这里保存的是多时相遥感影像数据(即每一个分幅条带号对应着多个不同时相的遥感影像文件),因此我们希望在目标文件夹中,同样用各个分幅条带号作为名称,创建多个子文件夹;然后将当前分幅条带号对应的全部遥感影像数据放入这一文件夹中。基于此,我们通过os.path.exists()函数判断是否存在指定的子文件夹,如果不存在的话就新建这一文件夹;随后,通过shutil.copy()函数复制这些遥感影像文件。

  运行上述代码,最终我们得到的结果如下图所示;其中,每一个子文件夹都表示一个分幅条带号,子文件夹内即为这一分幅条带号所对应的全部时相的遥感影像文件。

  至此,大功告成。

欢迎关注:疯狂学习GIS

相关文章
|
1月前
|
测试技术 API Python
【10月更文挑战第1天】python知识点100篇系列(13)-几种方法让你的电脑一直在工作
【10月更文挑战第1天】 本文介绍了如何通过Python自动操作鼠标或键盘使电脑保持活跃状态,避免自动息屏。提供了三种方法:1) 使用PyAutoGUI,通过安装pip工具并执行`pip install pyautogui`安装,利用`moveRel()`方法定时移动鼠标;2) 使用Pymouse,通过`pip install pyuserinput`安装,采用`move()`方法移动鼠标绝对位置;3) 使用PyKeyboard,同样需安装pyuserinput,模拟键盘操作。文中推荐使用PyAutoGUI,因其功能丰富且文档详尽。
WK
|
21天前
|
Python
Python中format_map()方法
在Python中,`format_map()`方法用于使用字典格式化字符串。它接受一个字典作为参数,用字典中的键值对替换字符串中的占位符。此方法适用于从字典动态获取值的场景,尤其在处理大量替换值时更为清晰和方便。
WK
68 36
|
1月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
11种经典时间序列预测方法:理论、Python实现与应用
本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。
63 2
11种经典时间序列预测方法:理论、Python实现与应用
|
13天前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
16 2
|
28天前
|
开发者 Python
Python中的魔法方法与运算符重载
在Python的奇妙世界里,魔法方法(Magic Methods)和运算符重载(Operator Overloading)是两个强大的特性,它们允许开发者以更自然、更直观的方式操作对象。本文将深入探讨这些概念,并通过实例展示如何利用它们来增强代码的可读性和表达力。
|
29天前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。
|
30天前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
|
5天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。