Python处理文件的常用代码

简介: Python处理文件的常用代码

日常工作中,我们经常会遇到一些查找、存储文件的问题,比如文件合并、文件分解等,这些问题涉及到对文件进行操作处理。对此,Python的OS库提供了很多功能模块供使用,本文整理了其中6个使用频率很高的常用代码,基本能满足大部分需求。另外,通过对一个excel文件合并案例代码进行解析,进一步加深印象,建议收藏。

一、6个常用代码
1、得到指定文件路径:os.path.dirname(带路径文件名)
查找处理文件要调用os库,和openpyxl一样,先用import 导入。

import os

file = r'e:\python\删除最小值.xlsx'

pwd = os.path.dirname(file)

print(pwd)

运行结果为:e:\python
//代码效果参考:http://www.ezhiqi.com/zx/art_4708.html

也可从分离文件名后的列表中提取:os.path.split(带路径文件名)[0]

2、得到当前文件名:os.path.dasename(带路径文件名)
import os

file = r'e:\python\删除最小值.xlsx'

pwdn = os.path.basename(file)

print(pwdn)

运行结果为:删除最小值.xlsx

也可从分离文件名后的列表中提取:os.path.split(带路径文件名)[1]

3、判断文件路径是否存在:os.path.exists(带路径文件名)
import os

file = r'e:\python\删除最小值.xlsx'

pwdbool = os.path.exists(file)

print(pwdbool)

运行结果为:true

若给定的路径文件不存在,则返回false

4、获得指定文件夹下所有文件:print(os.listdir(文件夹路径))
import os
//代码效果参考:http://www.ezhiqi.com/zx/art_1350.html

pwdns = os.listdir(r'e:\python')

print(pwdns[1])

运行结果:8.py 为'e:\python'文件夹下第2个文件(或文件夹)名。

5、获得文件后缀:os.path.splitext(文件名)
import os

pdn= os.path.splitext('试验.py')

print(pdn[1])

运行结果:.py,若最后一句改为print(pdn[0]),则得到文件名。

6、拼接路径和文件名:os.path.join(路径,文件名)
f2 = os.path.join(f1, '汇总.xlsx')

运行结果:'e:\python\汇总\汇总.xlsx'

二、文件合并案例代码解析:
在下面的文件夹“e:\python\汇总”里,有2个xlsx文件和一个txt文件,要求先判断当前文件夹内是否存在“汇总.xlsx”文件,若不存在则新建一个,若存在则直接打开使用,要求将其他.xlsx文件的第1个表单数据,汇总至“汇总.xlsx”文件。

初始文件

1、导入os库和openpyxl库,给定当前路径为模块参数

import os

import openpyxl

if name == "main":

tj(r'e:\python\汇总')# 指定文件夹作为参数,**文末有提醒事项"

2、在tj模块内写代码,先判断是否存在汇总.excle文件,若无则创建

def tj(f1):

f2 = os.path.join(f1, '汇总.xlsx')# 组合文件路径,**文末有提醒事项"

bl = os.path.exists(f2)# 判断'e:\python\汇总\汇总.xlsx'是否存在,存在返回true,不存在返回false

if bl is False:
//代码效果参考:http://www.ezhiqi.com/bx/art_851.html

wb = openpyxl.Workbook()# 如果不存在,创建新excel文件

ws = wb.active

ws.title = "汇总"# 设置当前表单名为“汇总”

wb.save(f2)# 将刚才创建的文件保存为:'e:\python\汇总\汇总.xlsx'

wb = openpyxl.load_workbook(f2)# 打开'e:\python\汇总\汇总.xlsx'文件

ws = wb['汇总']

ks = ws.max_row# 得到汇总表单的最大行,**文末有提醒事项"

3、遍历指定文件夹,将目标.xlsx文件放入列表k备用

pns = os.listdir(f1)# 获得f1文件夹下带后缀文件名列表

k = []

for i in range(len(pns)):

hz = os.path.splitext(pns[i])[1]# 获得f1文件夹下文件名列表

qz = os.path.splitext(pns[i])[0]# 获得f1文件夹下文件后缀列表

if hz == '.xlsx' and qz != '汇总':

k.append(pns[i])# 将后缀为.xlsx,且文件名不是汇总的文件名放入K列表

5、逐个打开目标文件,将第一个表单内的数据复制粘贴在汇总表内汇总表单内

m = 0

for w in k:

f3 = os.path.join(f1, w)

wb1 = openpyxl.load_workbook(f3)

ws1 = wb1._sheets[0]# 选第一个表单,默认数据在第一个表单,也可根据表单名进行选取。

for jj in range(1, ws1.max_row):

m += 1

for j in range(2, ws1.max_column + 1):

ws.cell(ks+m, j).value = ws1.cell(jj+1, j).value

ws.cell(ks+m, 1).value = ks+m-1# 重新写序号

ws.cell(ks+m, ws1.max_column+1).value = w# 写入当前行数据的来源文件名

wb.save(f2)# 保存文件

6、运行代码完成,此时汇总文件内已经合并了其他两个文件的数据。

程序运行后新建了汇总.xlsx

汇总文件内已完成数据汇总

三、几个细节
1、tj(r'e:\python\汇总'):给定参数时,路径前面有个字母“r”,为消除转义字符功能用。

2、os.path.join(f1, w):路径和文件名组合,也可用f1+'\'+w的方法,但只能限定于在打开文件的代码里用,单独使用会出现双“\”符号,导致地址无法使用。

3、ws1.max_row:得到表单的最大行数,当末行没有数据,只是设置过单元格格式,也被视为表单的最大行,这点不如VBA的end(3).row,需注意。

相关文章
|
7天前
|
缓存 监控 程序员
Python中的装饰器是一种特殊类型的声明,它允许程序员在不修改原有函数或类代码的基础上,通过在函数定义前添加额外的逻辑来增强或修改其行为。
【6月更文挑战第30天】Python装饰器是无侵入性地增强函数行为的工具,它们是接收函数并返回新函数的可调用对象。通过`@decorator`语法,可以在不修改原函数代码的情况下,添加如日志、性能监控等功能。装饰器促进代码复用、模块化,并保持源代码整洁。例如,`timer_decorator`能测量函数运行时间,展示其灵活性。
16 0
|
3天前
|
JSON 数据格式 Python
Flask实现内部接口----pycharm安装及新建,location代表着文件路径,下面是Python的环境,Flask是由Python开发的框架,Python文件接口ython通过GET发送
Flask实现内部接口----pycharm安装及新建,location代表着文件路径,下面是Python的环境,Flask是由Python开发的框架,Python文件接口ython通过GET发送
|
5天前
|
Linux iOS开发 MacOS
【超级简单】Python代码如何打包成exe文件
【超级简单】Python代码如何打包成exe文件
33 1
|
1天前
|
Python
告别混乱!Python上下文管理器的自定义实践,让你的代码更加整洁有序
【7月更文挑战第6天】Python的上下文管理器通过`__enter__`和`__exit__`方法自动处理资源的获取与释放,如文件操作。使用with语句结合自定义类(如`FileManager`示例),能确保文件在使用后正确关闭,防止资源泄漏,提升代码整洁度和健壮性。自定义上下文管理器是代码模块化和错误处理的好实践。
|
1天前
|
设计模式 Python
深度揭秘!Python元类:掌握它,让你的代码拥有创造类的能力
【7月更文挑战第6天】Python元类探秘:**元类是类的类,用于控制类的创建。通过定义元类,可自定义类的行为,如动态添加方法或改变继承结构。示例中,`my_metaclass`在创建类时添加`new_method`。元类强大且适用于高级编程,如动态修改、注册类或实现设计模式。理解并善用元类能提升Python编程技巧。
6 0
|
1天前
|
数据采集 程序员 Python
深度定制Python上下文管理器,让你的代码世界从此井井有条
【7月更文挑战第6天】Python的上下文管理器简化了资源管理,通过`__enter__`和`__exit__`方法自动处理获取和释放。例如,一个自定义的LoggingContextManager类在`__enter__`中配置日志并返回记录器,在`__exit__`中关闭文件。使用`with`语句,可以优雅地控制日志文件的生命周期,提高代码的整洁性和健壮性。
5 0
|
1天前
|
Python
Python大神的秘密武器:揭秘上下文管理器的自定义艺术,让代码更优雅
【7月更文挑战第6天】Python上下文管理器是资源管理的关键,与with语句结合确保自动释放,防止资源泄露。通过定义__enter__和__exit__方法的类或使用contextmanager装饰器的生成器,可自定义管理器,简化代码,增强健壮性,如资源获取与释放、异常处理和高级功能实现。掌握这一技巧能提升代码的优雅度和可维护性。**
|
1天前
|
Python
惊艳!原来Python闭包与装饰器可以这样玩,让你的代码瞬间高大上
【7月更文挑战第6天】Python中的闭包和装饰器是代码复用和增强功能的利器。闭包是能记住外部作用域变量的内嵌函数,常用于封装和优化代码。例如,`make_multiplier_of`生成了乘法函数,如`times3`和`times5`,避免了重复代码。装饰器则不修改原函数即可添加新功能,如`my_decorator`在函数调用前后打印信息。当两者结合,如`repeat`装饰器,可以根据参数动态改变函数行为,如重复执行`greet`函数。闭包和装饰器的协同使用提升了代码的优雅性、效率和可扩展性。
6 0
|
1天前
|
Python
告别代码冗余!Python闭包与装饰器如何让你秒变代码优化大师?
【7月更文挑战第6天】Python的闭包和装饰器是解决代码冗余的利器。闭包,如匿名函数,记忆外部作用域变量,实现代码封装。例如,`make_multiplier_of`生成特定乘法函数,避免重复。装饰器如`@my_decorator`,不修改原函数,添加额外功能,如在函数调用前后打印信息。两者结合,提升代码灵活性和复用性,是优化和整洁代码的关键。
4 0
|
2天前
|
机器学习/深度学习 数据采集 算法
【2024泰迪杯】A 题:生产线的故障自动识别与人员配置 Python代码实现
【2024泰迪杯】A 题:生产线的故障自动识别与人员配置 Python代码实现
11 0