Python--我一般都用这个模块压缩文件

简介: Python--我一般都用这个模块压缩文件

打包成压缩文件很多时候都能用上,也包括了自动化中的部分应用。例如,将测试报告打包发送。

本章就来介绍其中一个模块,可以用于结合上一章的内容结合使用。

from zipfile import ZipFile

ZipFile是zipfile的一个方法。

提取zip文件

from zipfile import ZipFile
file = r'three_\notes\zips.zip'
with ZipFile(file,'r') as zip:
    zip.printdir()
    print("~" * 30)
    zip.extractall()
    print("over")

需要提前准备一个.zip压缩文件。最好不要带中文,可能会文件名造成乱码。

File Name                                             Modified             Size
zips/headset.png                               2022-12-03 10:34:14         7532
zips/mouse.png                                 2022-12-03 10:34:14         5439
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
over

**printdir()**方法打印存档的目录。

**extractall()**方法会将zip文件的所有内容提取到当前工作目录中。

**extract()**方法来提取任何文件,方法是在 zip 文件中指定其路径。

zip.extract('zips/headset.png')

如果你想读取一些特定的文件,你可以这样:

data = zip.read(name_of_file_to_read)

写入zip文件

from zipfile import ZipFile
import os
def get_all_file_paths(directory):
    # 将文件写入列表
    file_paths = []
    # 获取指定路径的文件
    for root, directories, files in os.walk(directory):
        for filename in files:
            print(root,files)
            # 路径拼接
            filepath = os.path.join(root, filename)
            file_paths.append(filepath)
    # 返回所有路径
    return file_paths        
def main():
    # 需要压缩的路径
    directory = r'three_\notes\zips'
    # 传入遍历路径
    file_paths = get_all_file_paths(directory)
    # 打印压缩路径的内容
    print('Following files will be zipped:')
    for file_name in file_paths:
        print(file_name)
    # 写入压缩文件
    with ZipFile('my_python_files.zip','w') as zip:
        # 写入每一个文件
        for file in file_paths:
            zip.write(file)
    print('All files zipped successfully!')        
if __name__ == "__main__":
    main()

获取zip文件信息

from zipfile import ZipFile
import datetime
# 路径
file_name = r"three_\notes\zips.zip"
# 打开并读取其中的内容信息
with ZipFile(file_name, 'r') as zip:
    for info in zip.infolist():
            print(info.filename)
            print('\tModified:\t' + str(datetime.datetime(*info.date_time)))
            print('\tSystem:\t\t' + str(info.create_system) + '(0 = Windows, 3 = Unix)')
            print('\tZIP version:\t' + str(info.create_version))
            print('\tCompressed:\t' + str(info.compress_size) + ' bytes')
            print('\tUncompressed:\t' + str(info.file_size) + ' bytes')

以上就是该模块的大致用法,当然也有很多类似的模块,只要好用都可以。

目录
相关文章
|
12天前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
2月前
|
Python
Python Internet 模块
Python Internet 模块。
133 74
|
22天前
|
监控 网络安全 开发者
Python中的Paramiko与FTP文件夹及文件检测技巧
通过使用 Paramiko 和 FTP 库,开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力,而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具,您可以更加高效地管理和监控远程服务器上的文件系统。
52 20
|
28天前
|
存储 数据采集 数据处理
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
|
29天前
|
存储 JSON 对象存储
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
|
3月前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
141 63
|
3月前
|
测试技术 Python
手动解决Python模块和包依赖冲突的具体步骤是什么?
需要注意的是,手动解决依赖冲突可能需要一定的时间和经验,并且需要谨慎操作,避免引入新的问题。在实际操作中,还可以结合使用其他方法,如虚拟环境等,来更好地管理和解决依赖冲突😉。
|
1月前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
3月前
|
持续交付 Python
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。
|
1月前
|
Python
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
32 3

热门文章

最新文章