Python怎样统计文件夹(包括子文件夹)中文件的个数?

简介: 本文介绍基于Python语言,统计文件夹中文件数量;若其含有子文件夹,还将对各子文件夹中的文件数量一并进行统计的方法~

  本文介绍基于Python语言,统计文件夹中文件数量;若其含有子文件夹,还将对各子文件夹中的文件数量一并进行统计的方法。

  最近,需要统计多个文件夹内部的文件数量,包括其中所含子文件夹中的文件数量。其中,这多个需要统计文件数量的文件夹都放在一个总文件夹内。

  这一操作基于Python来实现是非常方便、快捷的。话不多说,我们对相关的Python代码来进行详细介绍。

import os

target_path='H:/2020/'

all_content=os.listdir(target_path)
print('All content numbers is',len(all_content))

count_num=1
for content in all_content:
    if os.path.isdir(target_path+content):
        all_sub_content=os.listdir(target_path+content)
        if len(all_sub_content)!=361:
            print(count_num,content,'sub content number is',len(all_sub_content))
            count_num=count_num+1

  可以看到,代码是非常非常简洁的。

  首先,target_path是我们的总文件夹路径,用os.listdir来获取总文件夹下面的全部内容(包括文件与子文件夹),并打印总文件夹下全部内容的数量(包括文件与子文件夹数量)。随后,用if判断与isdir函数来获取总文件夹下的全部子文件夹,并对子文件夹依次利用同样的方式来获取其内部文件的数量,并打印出来。

  其中,上述代码的以下部分:

        if len(all_sub_content)!=361:
            print(count_num,content,'sub content number is',len(all_sub_content))
            count_num=count_num+1

  是我为了方便,直接对不满足文件个数为361的子文件夹加以筛选,从而只输出文件个数非361的子文件夹名称;如果大家只是需要对每一个文件夹或子文件夹中的文件个数加以统计而不需要进行筛选,将这一部分的if判断语句去掉就可以啦~

  上面是对代码的初步介绍,如果大家还是不太清楚,可以查看具体的分步骤解释如下:

import os: 引入 os 模块以访问操作系统中的文件和目录
target_path = 'H:/2020/': 将文件路径存储在变量 target_path 中
all_content = os.listdir(target_path): 使用 os 模块中的 listdir() 函数列出 target_path 中的所有内容,并将结果存储在变量 all_content 中
print('All content numbers is', len(all_content)): 输出所有内容的数量,使用内置函数 len() 获取 all_content 的长度
count_num = 1: 初始化变量 count_num 为 1,用于输出信息时计数
for content in all_content:: 遍历 all_content 中的每个内容
if os.path.isdir(target_path+content):: 检查 content 是否是一个子目录,使用 os 模块中的 isdir() 函数
all_sub_content = os.listdir(target_path+content): 如果是子目录,则使用 listdir() 函数列出子目录中的所有内容,并将结果存储在变量 all_sub_content 中
if len(all_sub_content) != 361:: 如果子目录中的文件数量不足 361,则执行下一步
print(count_num, content, 'sub content number is', len(all_sub_content)): 输出当前检查的子目录的名称和文件数量,并将计数器 count_num 增加 1
循环结束后,函数执行结束

  最后,可以看到上述代码我是直接将结果打印出来的;如果实际情况中文件或文件夹数量很多,大家需要将结果输出到.csvExcel文件中的话,可以直接使用相应的函数加以导出就好了~

相关文章
|
11天前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
21天前
|
监控 网络安全 开发者
Python中的Paramiko与FTP文件夹及文件检测技巧
通过使用 Paramiko 和 FTP 库,开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力,而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具,您可以更加高效地管理和监控远程服务器上的文件系统。
51 20
|
27天前
|
存储 数据采集 数据处理
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
|
28天前
|
存储 JSON 对象存储
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
|
1月前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
Web App开发 数据采集 前端开发
用Python统计你的简书数据
写在前面   说来也巧,之前有一次无意间留意到简书好像没有做文章总阅读量的统计(准确的说法应该叫展示),刚好最近有时间,趁这个机会就用Python写了这么个功能,既是学习也是练手。
1399 0
|
23天前
|
存储 缓存 Java
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
58 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
2月前
|
Python
[oeasy]python055_python编程_容易出现的问题_函数名的重新赋值_print_int
本文介绍了Python编程中容易出现的问题,特别是函数名、类名和模块名的重新赋值。通过具体示例展示了将内建函数(如`print`、`int`、`max`)或模块名(如`os`)重新赋值为其他类型后,会导致原有功能失效。例如,将`print`赋值为整数后,无法再用其输出内容;将`int`赋值为整数后,无法再进行类型转换。重新赋值后,这些名称失去了原有的功能,可能导致程序错误。总结指出,已有的函数名、类名和模块名不适合覆盖赋新值,否则会失去原有功能。如果需要使用类似的变量名,建议采用其他命名方式以避免冲突。
52 14
|
2月前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
116 2
|
2月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
126 80

热门文章

最新文章

推荐镜像

更多