Python--glob一个不错的查找目录及文件的库

简介: Python--glob一个不错的查找目录及文件的库

使用glob模块能够快速查找我们想要的目录和文件。当然OS也可以完成这样的操作。

*:匹配0个或多个字符;    

**:匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增);

?:代匹配一个字符;

[]:匹配指定范围内的字符,如[0-9]匹配数字,[a-z]匹配小写字母;

主要函数

glob.glob():返回符合匹配条件的所有文件的路径;

glob.iglob():返回一个迭代器对象,需要循环遍历获取每个元素,得到的也是符合匹配条件的所有文件的路径;

glob.escape():escape可以忽略所有的特殊字符,就是星号、问号、中括号,用处不大; recursive=False:代表递归调用,与特殊通配符“**”一同使用,默认为False,False表示不递归调用,True表示递归调用;

例子

import glob
print(glob.glob('*'))   # 匹配当前路径下所有的文件及文件夹,并返回列表
print(glob.glob('*.*')) # 匹配当前路径下所有带.的文件
print(glob.glob('*.py'))    # 匹配当前路径下所有的.py文件
print(glob.glob('hh?'))     # 匹配hh开头并后面紧跟一个字符的文件夹
print(glob.glob('hh1[2]'))  # 匹配hh1开头且后面紧跟数字2的文件夹
['11.tml', 'config,toml', 'config.ini', 'config.json', 'config.yaml', 'config1.csv', 'csv_read.py', 'glob_.py', 'hh12', 'hh_', 'log.txt', 'test_one.py', 'toml_read.py', 'Yaml_read.py', '__pycache__', '作用域.py', '闭包.py']
['11.tml', 'config.ini', 'config.json', 'config.yaml', 'config1.csv', 'csv_read.py', 'glob_.py', 'log.txt', 'test_one.py', 'toml_read.py', 'Yaml_read.py', '作用域.py', '闭包.py']
['csv_read.py', 'glob_.py', 'test_one.py', 'toml_read.py', 'Yaml_read.py', '作用域.py', '闭包.py']
['hh_']
['hh12']

当然也可以是绝对路径亦或者自己写定的先对路径:

import glob
print(glob.glob('../lib/*'))
"""
['../lib\\chromedriver.exe', '../lib\\geckodriver.exe', '../lib\\IEDriverServer.exe']
"""

recursive参数

import glob
print(glob.glob("**"))
print(glob.glob("**",recursive=True))
"""
['11.tml', 'config,toml', 'config.ini', 'config.json', 'config.yaml', 'config1.csv', 'csv_read.py', 'glob_.py', 'hh12', 'hh_', 'log.txt', 'test_one.py', 'toml_read.py', 'Yaml_read.py', '__pycache__', '作用域.py', '闭包.py']
['11.tml', 'config,toml', 'config.ini', 'config.json', 'config.yaml', 'config1.csv', 'csv_read.py', 'glob_.py', 'hh12', 'hh_', 'log.txt', 'test_one.py', 'toml_read.py', 'Yaml_read.py', '__pycache__', '__pycache__\\test_one.cpython-39-pytest-7.1.3.pyc', '__pycache__\\toml_read.cpython-39.pyc', '作用域.py', '闭包.py']
"""

总体上没有太大的区别,细微的区别体现!**搭配recursive且为True的时候可以将子文件夹中的文件夹中的文件都匹配出来。

与OS模块比较

import os
for dirpath,dirname,filename in os.walk('.'):
    for name in filename:
        if 'con' in name:
            filepath = os.path.join(dirpath,name)
            print(filepath)
"""
.\config,toml
.\config.ini
.\config.json
.\config.yaml
.\config1.csv
"""
import glob
for i in glob.glob(r'.\con*',recursive=True):
    print(i)
"""
.\config,toml
.\config.ini
.\config.json
.\config.yaml
.\config1.csv
"""

至于优劣,此处不做评价,此处就代码量上说,glob是比较简短的。区别就是路径上的一点点小区别,无伤大雅。

iglob

import glob
paths = glob.iglob("*")
print(paths)
for j in paths:
    print(j)

warning 它返回一个生成器,所以需要使用循环进行取值操作。其作用与glob.glob类似。

目录
相关文章
|
17天前
|
调度 开发者 Python
Python中的异步编程:理解asyncio库
在Python的世界里,异步编程是一种高效处理I/O密集型任务的方法。本文将深入探讨Python的asyncio库,它是实现异步编程的核心。我们将从asyncio的基本概念出发,逐步解析事件循环、协程、任务和期货的概念,并通过实例展示如何使用asyncio来编写异步代码。不同于传统的同步编程,异步编程能够让程序在等待I/O操作完成时释放资源去处理其他任务,从而提高程序的整体效率和响应速度。
|
20天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
51 0
|
6天前
|
XML 存储 数据库
Python中的xmltodict库
xmltodict是Python中用于处理XML数据的强大库,可将XML数据与Python字典相互转换,适用于Web服务、配置文件读取及数据转换等场景。通过`parse`和`unparse`函数,轻松实现XML与字典间的转换,支持复杂结构和属性处理,并能有效管理错误。此外,还提供了实战案例,展示如何从XML配置文件中读取数据库连接信息并使用。
Python中的xmltodict库
|
13天前
|
数据库 Python
异步编程不再难!Python asyncio库实战,让你的代码流畅如丝!
在编程中,随着应用复杂度的提升,对并发和异步处理的需求日益增长。Python的asyncio库通过async和await关键字,简化了异步编程,使其变得流畅高效。本文将通过实战示例,介绍异步编程的基本概念、如何使用asyncio编写异步代码以及处理多个异步任务的方法,帮助你掌握异步编程技巧,提高代码性能。
49 4
|
1月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
13天前
|
API 数据处理 Python
探秘Python并发新世界:asyncio库,让你的代码并发更优雅!
在Python编程中,随着网络应用和数据处理需求的增长,并发编程变得愈发重要。asyncio库作为Python 3.4及以上版本的标准库,以其简洁的API和强大的异步编程能力,成为提升性能和优化资源利用的关键工具。本文介绍了asyncio的基本概念、异步函数的定义与使用、并发控制和资源管理等核心功能,通过具体示例展示了如何高效地编写并发代码。
25 2
|
18天前
|
数据采集 JSON 测试技术
Python爬虫神器requests库的使用
在现代编程中,网络请求是必不可少的部分。本文详细介绍 Python 的 requests 库,一个功能强大且易用的 HTTP 请求库。内容涵盖安装、基本功能(如发送 GET 和 POST 请求、设置请求头、处理响应)、高级功能(如会话管理和文件上传)以及实际应用场景。通过本文,你将全面掌握 requests 库的使用方法。🚀🌟
38 7
|
16天前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
17 2
|
19天前
|
机器学习/深度学习 数据采集 算法
Python机器学习:Scikit-learn库的高效使用技巧
【10月更文挑战第28天】Scikit-learn 是 Python 中最受欢迎的机器学习库之一,以其简洁的 API、丰富的算法和良好的文档支持而受到开发者喜爱。本文介绍了 Scikit-learn 的高效使用技巧,包括数据预处理(如使用 Pipeline 和 ColumnTransformer)、模型选择与评估(如交叉验证和 GridSearchCV)以及模型持久化(如使用 joblib)。通过这些技巧,你可以在机器学习项目中事半功倍。
24 3
|
22天前
|
数据采集 数据可视化 数据处理
如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`)
本文介绍了如何使用Python实现一个交易策略。主要步骤包括:导入所需库(如`pandas`、`numpy`、`matplotlib`),加载历史数据,计算均线和其他技术指标,实现交易逻辑,记录和可视化交易结果。示例代码展示了如何根据均线交叉和价格条件进行开仓、止损和止盈操作。实际应用时需注意数据质量、交易成本和风险管理。
47 5
下一篇
无影云桌面