Python遍历多个子文件夹并基于文件名特征将文件复制到不同的目标文件夹

简介: Python遍历多个子文件夹并基于文件名特征将文件复制到不同的目标文件夹

  本文介绍基于Python语言,遍历一个大文件夹中大量的子文件夹,并将每一个子文件夹中大量的文件,按照每一个文件的文件名称的特点与差异,自动创建多个目标文件夹,并将指定文件复制到不同的目标文件夹中的方法。

  首先,我们来明确一下本文的需求。现在有一个大文件夹,其中具有多个表示年份子文件夹,每一个子文件夹对应一个年份;如下图所示。

  其次,在每一个表示年份子文件夹中,同样具有着大量的子文件夹,此时每一个子文件夹表示一个天数;以上图中的2018文件夹为例,将其打开后,如下图所示。

  随后,每一个表示天数子文件夹中,就是我们希望加以提取、复制的文件了(在本中,就是一些.tif格式的遥感影像文件;如果大家需要复制其他格式的文件,思路和本文也都是一致的);我们以2018文件夹中的001子文件夹为例,将其打开后如下图所示。但是,这些文件自身还有一定特征——首先,如下图左侧绿色框内的部分所示,这些遥感影像文件来自不同的分幅,而这一部分的文字就是表示了他的分幅;我们希望,将同一个分幅所有遥感影像文件在后期复制到同一个文件夹内(比如所有名称带有50TMK字样的遥感影像文件,都放在名称为50TMK的目标文件夹中);其次,那些以_QC.tif字段结尾的遥感影像我们都不需要,无需复制,只复制不带_QC字段的遥感影像文件即可。

  明确了需求,我们就可以开始代码的撰写。

# -*- coding: utf-8 -*-
"""
Created on Thu Aug 17 00:14:16 2023
@author: fkxxgis
"""
import os
import shutil
source_folder = "F:/ers"
target_folder = "F:/Beijing_Preprocessing"
for year_folder in os.listdir(source_folder):
    year_path = os.path.join(source_folder, year_folder)
    if not os.path.isdir(year_path):
        continue
    for day_folder in os.listdir(year_path):
        day_path = os.path.join(year_path, day_folder)
        if not os.path.isdir(day_path):
            continue
        for image_file in os.listdir(day_path):
            if image_file.endswith("NDVI.tif"):
                index = image_file[-25 : -20]
                source_image_path = os.path.join(day_path, image_file)
                target_image_path = os.path.join(target_folder, index, image_file)
                if not os.path.isdir(os.path.join(target_folder, index)):
                    os.makedirs(os.path.join(target_folder, index))
                shutil.copy(source_image_path, target_image_path)
                print(year_folder, " ", day_folder)

  其中,source_foldertarget_folder分别指定了源文件夹(就是存放有原始遥感影像文件的大文件夹)和目标文件夹(也就是我们希望将遥感影像复制到的结果文件夹)的路径。

  随后,我们通过for year_folder in os.listdir(source_folder):遍历源文件夹中,表示年份的子文件夹。其后的year_path = os.path.join(source_folder, year_folder)用来生成年份子文件夹的完整路径。同时可以通过一个if语句来加以判断——如果当前路径不是文件夹,则跳过本次循环。随后,通过类似的方式,遍历当前年份子文件夹中的天数子文件夹。

  接下来,就可以通过for image_file in os.listdir(day_path):来遍历当前天数子文件夹中的文件。在这里,我们需要加以判断——如果文件名以 NDVI.tif结尾,表示这是我们想要的遥感影像文件。

  其次,index = image_file[-25 : -20]则是用来从文件名中提取索引,这个索引就是遥感影像的分幅,我们将其提取出来,用来构建不同分幅对应的目标文件夹。其后面的一个判断if not os.path.isdir(os.path.join(target_folder, index)):,就是检查每一个遥感影像的分幅,如果这一分幅对应的目标路径不存在,创建对应的目录结构。

  最后,我们使用shutil库的copy函数,将遥感影像文件复制到对应的目标路径内。

  运行上述代码,我们即可在目标文件夹中,首先看到每一个分幅的对应的子文件夹,如下图所示(我这里就是只有4个分幅)。

  而在每一个分幅子文件夹内,所有遥感影像都是这一分幅对应的文件,如下图所示。

  至此,大功告成。

欢迎关注:疯狂学习GIS

相关文章
|
6天前
|
计算机视觉 Python
如何使用Python将TS文件转换为MP4
本文介绍了如何使用Python和FFmpeg将TS文件转换为MP4文件。首先需要安装Python和FFmpeg,然后通过`subprocess`模块调用FFmpeg命令,实现文件格式的转换。代码示例展示了具体的操作步骤,包括检查文件存在性、构建FFmpeg命令和执行转换过程。
29 7
|
1月前
|
算法 定位技术 Python
震惊!Python 图结构竟然可以这样玩?DFS&BFS 遍历技巧大公开
在 Python 编程中,图是一种重要的数据结构,而深度优先搜索(DFS)和广度优先搜索(BFS)是遍历图的两种关键算法。本文将通过定义图的数据结构、实现 DFS 和 BFS 算法,并通过具体示例展示其应用,帮助读者深入理解这两种算法。DFS 适用于寻找路径和检查图连通性,而 BFS 适用于寻找最短路径。掌握这些技巧,可以更高效地解决与图相关的复杂问题。
28 2
|
2月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
1月前
|
Python
不容错过!Python中图的精妙表示与高效遍历策略,提升你的编程艺术感
本文介绍了Python中图的表示方法及遍历策略。图可通过邻接表或邻接矩阵表示,前者节省空间适合稀疏图,后者便于检查连接但占用更多空间。文章详细展示了邻接表和邻接矩阵的实现,并讲解了深度优先搜索(DFS)和广度优先搜索(BFS)的遍历方法,帮助读者掌握图的基本操作和应用技巧。
36 4
|
1月前
|
算法 Python
Python图论探索:从理论到实践,DFS与BFS遍历技巧让你秒变技术大牛
图论在数据结构与算法中占据重要地位,应用广泛。本文通过Python代码实现深度优先搜索(DFS)和广度优先搜索(BFS),帮助读者掌握图的遍历技巧。DFS沿路径深入搜索,BFS逐层向外扩展,两者各具优势。掌握这些技巧,为解决复杂问题打下坚实基础。
37 2
|
1月前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
44 2
|
1月前
|
中间件 Docker Python
【Azure Function】FTP上传了Python Function文件后,无法在门户页面加载函数的问题
通过FTP上传Python Function至Azure云后,出现函数列表无法加载的问题。经排查,发现是由于`requirements.txt`中的依赖包未被正确安装。解决方法为:在本地安装依赖包到`.python_packages/lib/site-packages`目录,再将该目录内容上传至云上的`wwwroot`目录,并重启应用。最终成功加载函数列表。
|
2月前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。
|
2月前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
|
6月前
|
移动开发 Unix Linux
Python 遍历文件每一行判断是否只有一个换行符详解
**Python 检查文件每行换行符:** 文章探讨了在Python中验证文件每行是否仅含一个换行符的需求。通过提供代码示例,展示了如何打开文件,遍历行,判断行尾的换行情况。基础实现检查`\n`,扩展版考虑了`\r\n`,并可选地将结果保存至新文件。这些功能有助于确保数据格式规范。
下一篇
DataWorks