C++遍历文件夹获取各文件名称并筛选指定格式类型的文件或具有特定名称的文件

简介: C++遍历文件夹获取各文件名称并筛选指定格式类型的文件或具有特定名称的文件

  本文介绍基于C++ 语言,遍历文件夹中的全部文件,并从中获取指定类型的文件的方法。

  首先,我们来明确一下本文所需实现的需求。现在有一个文件夹,其中包含了很多文件,如下图所示;我们如果想获取其中所有类型为.bmp格式的文件的名称,如果文件数量比较多的话,手动筛选就会很麻烦。而借助C++ 代码就可以简单地实现这一需求。如果需要借助Python代码来实现同样的需求,可以参考文章Python中ArcPy实现栅格图像文件批量掩膜与批量重采样https://blog.csdn.net/zhebushibiaoshifu/article/details/124282764),基于其中提到的arcpy.ListRasters()函数来实现。

  首先需要说明的是,本文代码只能实现对某一文件夹下的文件进行遍历并筛选;如果是当前文件夹下的子文件夹中的文件,这一代码是没有办法遍历的。大家如果有相关需求的话,可以尝试在本文代码中加几个判断语句来实现;或者参考Python中ArcPy实现栅格图像文件由HDF格式批量转换为TIFF格式https://blog.csdn.net/zhebushibiaoshifu/article/details/124200816)、基于Python获取文件夹中文件数量与其子文件夹中文件数量https://blog.csdn.net/zhebushibiaoshifu/article/details/116704598)这两篇文章,基于其中提到的方法用Python代码来实现。

  本文分为两部分,第一部分为代码的分段讲解,第二部分为完整代码。

1 分段代码介绍

1.1 代码准备

  这一部分主要是代码的头文件、命名空间与我们自行撰写的自定义函数get_need_file()的声明;具体代码如下所示。

#include <iostream>
#include <vector>
#include <io.h>
using namespace std;
void get_need_file(string path, vector<string>& file, string ext);

  其中,由于我们在接下来的代码中需要用到容器vector这一数据类型,因此首先需要添加#include <vector>;同时,我们在接下来的代码中需要用到头文件io.h中的部分函数(主要都是一些与计算机系统、文件管理相关的函数),因此需要添加#include <io.h>

  接下来,这里声明了一个自定义函数get_need_file(),具体我们在本文1.3部分介绍。

1.2 主函数

  这一部分介绍代码的main()函数;具体代码如下所示。

int main() {
  string file_path = R"(E:\02_Project\02_ChlorophyllProduce\01_Data\00_Test)";
  vector<string> my_file;
  string need_extension = ".bmp";
  get_need_file(file_path, my_file, need_extension);
  for (int i = 0; i < my_file.size(); i++)
  {
    cout << "File " << i+1 << " is:" << endl;
    cout << my_file[i] << endl;
  }
  if (my_file.size() == 0)
  {
    cout << "No file can be found!" << endl;
  }
  else
  {
    cout << endl << "Find " << my_file.size() << " file(s)." << endl;
  }
  return 0;
}

  首先,我们定义了几个后续代码需要用到的变量。其中,file_path是一个字符串string变量,表示我们需要进行文件遍历的文件夹路径;这里我们用R"()"取消其中路径转义字符的使用。my_file是一个容器vector变量,其中将会存储我们需要筛选出来的特定文件。need_extension是我们需要筛选出来的特定文件的格式后缀。这些变量是如何工作的,具体我们在本文1.3部分介绍。

  随后,调用自定义函数get_need_file();调用完毕后,my_file中就存储了我们需要筛选出来的特定文件(如果有的话)。

  最后,for循环来输出我们找到的文件名称;if判断则是输出我们最终有没有筛选出指定格式的文件,如果筛选出来的话则会输出具体筛选出的文件数量。

  主函数部分整体比较简单,这里就不再赘述。

1.3 自定义函数

  这一部分介绍代码的自定义函数get_need_file(),也是本文最重要的部分;具体代码如下所示。

void get_need_file(string path, vector<string>& file, string ext)
{
  intptr_t file_handle = 0;
  struct _finddata_t file_info;
  string temp;
  if ((file_handle = _findfirst(temp.assign(path).append("/*" + ext).c_str(), &file_info)) != -1)
  {
    do
    {
      file.push_back(temp.assign(path).append("/").append(file_info.name));
    } while (_findnext(file_handle, &file_info) == 0);
    _findclose(file_handle);
  }
}

  其中,自定义函数get_need_file()的三个参数,依次就是我们在主函数中定义的三个变量。

  在自定义函数get_need_file()中,我们首先定义了intptr_t类型的变量file_handle,并对其赋值为0。首先,这里的intptr_t是一种与计算机系统有关的数据类型,专门用来存放指针的地址;相较于用标准的int格式、long格式存储指针的地址,其具有更高的安全性,因此在计算机系统中通常用其存储指针的地址。其次,这里的file_handle表示文件句柄;在计算机系统中,每一个文件都有一个唯一的编号(相当于我们每一个人都有一个唯一的身份证号码),不同的文件具有不同的句柄,依据这一个句柄计算机系统就能锁定其对应的那个唯一的文件。因为文件句柄就是一个指向指针的指针,亦即指针的地址,因此我们就将其设定为intptr_t类型。此外,为其赋值为0,就是相当于先暂时随便给它赋一个肯定不对的数值,之后程序会自动替换。

  接下来,我们定义一个_finddata_t类型的变量file_info。首先,这里的_finddata_t其实是一个结构体,专门用来存储计算机系统中不同文件的各类信息;而file_info就是文件的不同信息。前面我们提到,file_handle相当于我们的身份证号码,那么这里file_info相当于就是存储了我们性别、家庭住址、爱好等信息的个人信息库。

  随后,我们再定义一个字符串string类型的变量temp,其用来存储临时生成的文件路径。

  接下来,进入if判断语句;这里我们将其拆开来看。首先,temp.assign(path).append("/*" + ext)其实就表示我们需要筛选的特定格式的文件,在本文中即E:\02_Project\02_ChlorophyllProduce\01_Data\00_Test)/*.bmp,并将其通过.assign()函数赋给字符串temp。随后,.c_str()函数将前面赋值好的字符串temp转为标准的C语言的格式(这是因为后面操作需要保证字符串为标准的C语言格式)。随后,将转换好的C语言格式字符串作为第一个参数,带入_findfirst()函数;其第二个参数则是file_info_findfirst()函数的功能是在当前路径下,找到与第一个参数(在这里也就是转换好的C语言格式字符串)相匹配的第一个文件;如果能找到这个文件,那么其就返回该文件的句柄,并将该文件的信息放入file_info;如果找不到这个文件,那么该函数就返回-1。因此,这里的if判断语句表示,一旦在当前路径下找到我们需要的文件,就继续进行接下来的代码;如果找不到需要的文件,那么相当于当前文件夹下就没有符合我们要求的文件。

  接下来,执行do语句内部的代码。其中,temp.assign(path).append("/").append(file_info.name)就表示当前找到的文件的路径及其名称,并通过push_back()函数将其附加至vector变量file的末尾。随后,进行while语句内部代码的判断——其中,_findnext()函数其实和前面的_findfirst()函数比较类似,它的作用是按照当前_findfirst()函数中所指定的文件筛选要求,进行继续筛选(_findfirst()函数相当于是找到了第一个符合我们筛选要求的文件,而_findnext()函数就是继续找,找到下一个符合要求的文件);如果其找到了,那么就将所找到的文件的句柄与信息返回到其两个参数中,且返回一个值0;如果没有找到的话就返回-1。因此,这里while语句相当于就是判断当前路径下还有没有我们需要的文件,如果有的话就再执行do语句内部的代码(即将文件的路径放入vector变量file的末尾);如果没有的话,那么就结束前面的循环。

  最后,_findclose()表示将当前句柄所表示的文件加以关闭,并将对应的文件资源释放。

2 完整代码

  本文所用到的全部代码如下。

#include <iostream>
#include <vector>
#include <io.h>
using namespace std;
void get_need_file(string path, vector<string>& file, string ext);
int main() {
  string file_path = R"(E:\02_Project\02_ChlorophyllProduce\01_Data\00_Test)";
  vector<string> my_file;
  string need_extension = ".bmp";
  get_need_file(file_path, my_file, need_extension);
  for (int i = 0; i < my_file.size(); i++)
  {
    cout << "File " << i + 1 << " is:" << endl;
    cout << my_file[i] << endl;
  }
  if (my_file.size() == 0)
  {
    cout << "No file can be found!" << endl;
  }
  else
  {
    cout << endl << "Find " << my_file.size() << " file(s)." << endl;
  }
  return 0;
}
void get_need_file(string path, vector<string>& file, string ext)
{
  intptr_t file_handle = 0;
  struct _finddata_t file_info;
  string temp;
  if ((file_handle = _findfirst(temp.assign(path).append("/*" + ext).c_str(), &file_info)) != -1)
  {
    do
    {
      file.push_back(temp.assign(path).append("/").append(file_info.name));
    } while (_findnext(file_handle, &file_info) == 0);
    _findclose(file_handle);
  }
}

  运行上述代码后,将会得到所筛选出的文件各自的名称,以及其具体数量。

  至此,大功告成。

欢迎关注:疯狂学习GIS

相关文章
|
8月前
|
C++ Windows
.NET Framework安装不成功,下载`NET Framework 3.5`文件,Microsoft Visual C++
.NET Framework常见问题及解决方案汇总,涵盖缺失组件、安装失败、错误代码等,提供多种修复方法,包括全能王DLL修复工具、微软官方运行库及命令行安装等,适用于Windows系统,解决应用程序无法运行问题。
1247 3
|
9月前
|
存储 算法 安全
c++模板进阶操作——非类型模板参数、模板的特化以及模板的分离编译
在 C++ 中,仿函数(Functor)是指重载了函数调用运算符()的对象。仿函数可以像普通函数一样被调用,但它们实际上是对象,可以携带状态并具有更多功能。与普通函数相比,仿函数具有更强的灵活性和可扩展性。仿函数通常通过定义一个包含operator()的类来实现。public:// 重载函数调用运算符Add add;// 创建 Add 类的对象// 使用仿函数return 0;
292 0
|
安全 C++
【c++】继承(继承的定义格式、赋值兼容转换、多继承、派生类默认成员函数规则、继承与友元、继承与静态成员)
本文深入探讨了C++中的继承机制,作为面向对象编程(OOP)的核心特性之一。继承通过允许派生类扩展基类的属性和方法,极大促进了代码复用,增强了代码的可维护性和可扩展性。文章详细介绍了继承的基本概念、定义格式、继承方式(public、protected、private)、赋值兼容转换、作用域问题、默认成员函数规则、继承与友元、静态成员、多继承及菱形继承问题,并对比了继承与组合的优缺点。最后总结指出,虽然继承提高了代码灵活性和复用率,但也带来了耦合度高的问题,建议在“has-a”和“is-a”关系同时存在时优先使用组合。
782 6
|
存储 算法 测试技术
【C++数据结构——树】二叉树的遍历算法(头歌教学实验平台习题) 【合集】
本任务旨在实现二叉树的遍历,包括先序、中序、后序和层次遍历。首先介绍了二叉树的基本概念与结构定义,并通过C++代码示例展示了如何定义二叉树节点及构建二叉树。接着详细讲解了四种遍历方法的递归实现逻辑,以及层次遍历中队列的应用。最后提供了测试用例和预期输出,确保代码正确性。通过这些内容,帮助读者理解并掌握二叉树遍历的核心思想与实现技巧。
623 3
|
存储 算法 安全
基于哈希表的文件共享平台 C++ 算法实现与分析
在数字化时代,文件共享平台不可或缺。本文探讨哈希表在文件共享中的应用,包括原理、优势及C++实现。哈希表通过键值对快速访问文件元数据(如文件名、大小、位置等),查找时间复杂度为O(1),显著提升查找速度和用户体验。代码示例展示了文件上传和搜索功能,实际应用中需解决哈希冲突、动态扩容和线程安全等问题,以优化性能。
|
存储 编译器 Linux
【c++】类和对象(上)(类的定义格式、访问限定符、类域、类的实例化、对象的内存大小、this指针)
本文介绍了C++中的类和对象,包括类的概念、定义格式、访问限定符、类域、对象的创建及内存大小、以及this指针。通过示例代码详细解释了类的定义、成员函数和成员变量的作用,以及如何使用访问限定符控制成员的访问权限。此外,还讨论了对象的内存分配规则和this指针的使用场景,帮助读者深入理解面向对象编程的核心概念。
755 4
|
数据采集 存储 算法
【C++数据结构——图】图的遍历(头歌教学实验平台习题) 【合集】
本文介绍了图的遍历算法,包括深度优先遍历(DFS)和广度优先遍历(BFS)。深度优先遍历通过递归方式从起始节点深入探索图,适用于寻找路径、拓扑排序等场景;广度优先遍历则按层次逐层访问节点,适合无权图最短路径和网络爬虫等应用。文中提供了C++代码示例,演示了如何实现这两种遍历方法,并附有测试用例及结果,帮助读者理解和实践图的遍历算法。
772 0
|
Linux C++
Linux c/c++文件虚拟内存映射
这篇文章介绍了在Linux环境下,如何使用虚拟内存映射技术来提高文件读写的速度,并通过C/C++代码示例展示了文件映射的整个流程。
494 0
|
编译器 C++ 开发者
【C++篇】深度解析类与对象(下)
在上一篇博客中,我们学习了C++的基础类与对象概念,包括类的定义、对象的使用和构造函数的作用。在这一篇,我们将深入探讨C++类的一些重要特性,如构造函数的高级用法、类型转换、static成员、友元、内部类、匿名对象,以及对象拷贝优化等。这些内容可以帮助你更好地理解和应用面向对象编程的核心理念,提升代码的健壮性、灵活性和可维护性。
|
11月前
|
编译器 C++ 容器
【c++11】c++11新特性(上)(列表初始化、右值引用和移动语义、类的新默认成员函数、lambda表达式)
C++11为C++带来了革命性变化,引入了列表初始化、右值引用、移动语义、类的新默认成员函数和lambda表达式等特性。列表初始化统一了对象初始化方式,initializer_list简化了容器多元素初始化;右值引用和移动语义优化了资源管理,减少拷贝开销;类新增移动构造和移动赋值函数提升性能;lambda表达式提供匿名函数对象,增强代码简洁性和灵活性。这些特性共同推动了现代C++编程的发展,提升了开发效率与程序性能。
450 12