本文介绍基于Python语言,读取一个文件夹,并将其中每一个子文件夹内符合名称要求的文件加以筛选,并将筛选得到的文件复制到另一个目标文件夹中的方法。
本文的需求是:现在有一个大的文件夹,其中含有多个子文件夹,如下图所示。
对于其中的每一个子文件夹,都含有大量的文件;例如,我们就打开上图中的2021
文件夹,得到结果如下图所示。
我们的需求是,希望基于每一个子文件夹内的每一个文件,将文件名称中含有指定字段的文件提取出来——在本文中,我们就希望提取得到文件名称中含有STB
字段的,也就是上图紫色框内出现STB
的文件是我们需要的。提取到全部符合要求的文件后,我们还需要将这些文件都复制到另一个目标文件夹中。
明确了需求,接下来就可以开始代码的撰写。本文所用到的代码如下所示。
#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Mon Oct 2 12:48:49 2023 @author: fkxxgis """ import os import shutil source_folder = "/media/dell/H30-35/GF_SR" target_folder = "/media/dell/H30-35/GF_SR/STB" if not os.path.exists(target_folder): os.makedirs(target_folder) year_folders = [f for f in os.listdir(source_folder) if os.path.isdir(os.path.join(source_folder, f))] for year_folder in year_folders: if year_folder == "STB": continue year_folder_path = os.path.join(source_folder, year_folder) for file_name in os.listdir(year_folder_path): if "STB" in file_name: source_file = os.path.join(year_folder_path, file_name) target_file = os.path.join(target_folder, file_name) shutil.copy(source_file, target_file)
其中,我们导入了os
和shutil
模块,它们都提供了处理文件和目录的功能;同时,我们定义了源文件夹路径source_folder
(也就是存储有多个子文件夹的文件夹路径)和目标文件夹路径target_folder
(也就是最终结果存放的路径)。
随后,我们使用os.makedirs()
函数检查目标文件夹是否存在,如果不存在则创建它。接下来,我们使用列表推导式生成一个包含源文件夹中所有子文件夹的列表year_folders
;其中,我们使用了os.listdir()
函数获取源文件夹中的所有文件和文件夹,并使用os.path.isdir()
函数判断是否为文件夹。
接下来,我们就开始遍历每个子文件夹。首先,需要注意的是,我们要检查当前遍历的子文件夹是否为我们的目标文件夹路径STB
;如果是,则跳过该子文件夹的处理——这一步骤是防止我们用来存放结果的目标文件夹也被遍历,否则就会出现文件复制冲突。
其次,构建当前遍历的子文件夹的完整路径year_folder_path
,并使用os.listdir()
函数获取子文件夹中的所有文件。随后,再遍历刚刚得到的子文件夹中的每个文件——如果文件名包含STB
,那么这个文件就是我们需要的文件;我们就构建源文件(待复制的文件)的完整路径source_file
和目标文件(预计复制完毕的文件)的完整路径target_file
,并紧接着使用shutil.copy()
函数将源文件复制到目标文件。
通过这样的遍历,我们就能够将源文件夹路径source_folder
中全部含有STB
字段的文件复制到我们的目标文件夹中了。
执行上述代码,即可在我们的目标文件夹中看到全部含有STB
字段的文件,如下图所示。
至此,大功告成。
欢迎关注:疯狂学习GIS