python的压缩模块zipfile详解

简介: python的压缩模块zipfile详解

zipfile

zipfile是python里用来做zip格式编码的压缩和解压缩的 zipfile里有两个非常常用的class,

分别是ZipFile和ZipInfo, 在绝大多数的情况下,我们只需要使用这两个class就可以了。

ZipFile是主要的类,用来创建和读取zip文件。

ZipInfo是存储的zip文件的每个文件的信息的。

#zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])

#ZipFile(路径包名,模式,压缩or打包,可选allowZip64)

#功能:创建一个ZipFile对象,表示一个zip文件.

#参数:

-参数file表示文件的路径或类文件对象(file-like object)

-参数mode指示打开zip文件的模式,默认值为r

r 表示读取已经存在的zip文件

w 表示新建一个zip文档或覆盖一个已经存在的zip文档

a 表示将数据追加到一个现存的zip文档中。

-参数compression表示在写zip文档时使用的压缩方法

zipfile.ZIP_STORED 只是存储模式,不会对文件进行压缩,这个是默认值

zipfile.ZIP_DEFLATED 对文件进行压缩

allowZip64:是个bool型变量,当设置为True的时候就是说可以用来创建大小大于2G的zip文件,默认值是True;

-如果要操作的zip文件大小超过2G,应该将allowZip64设置为True。原码

ZipFile类的常用方法

ZipFile.close(): 关闭文件,结束时必须要有

ZipFile.getinfo(name): 获取zip文档内指定文件的信息。返回一个zipfile.ZipInfo对象,它包括文件的详细信息。

ZipFile.infolist(): 获取zip文档内所有文件的信息,返回一个zipfile.ZipInfo的列表。

ZipFile.namelist(): 获取zip文档内所有文件的名称列表。

ZipFile.extract(member[, path[, pwd]]):将zip文档内的指定文件解压到当前目录。

ZipFile.extractall([path[, members[, pwd]]]): 解压zip文档中的所有文件到当前目录。

ZipFile.printdir(): 将zip文档内的信息打印到控制台上。

ZipFile.setpassword(pwd): 设置zip文档的密码,这个方法我用的时候不好使,暂时没找到问题所在,建议要加密码使用 Python调用linux系统命令加密,或者调用windows里安装的压缩软件加密。

ZipFile.read(name[, pwd]): 获取zip文档内指定文件的二进制数据。

ZipFile.write(filename[, arcname[, compress_type]]):将指定文件添加到zip文档中。

ZipFile.writestr(zinfo_or_arcname, bytes): writestr()支持将二进制数据直接写入到压缩文档。

#压缩文件

#1.ZipFile() 写模式w打开或者新建压缩文件

#2.write(路径,别名) 向压缩文件中添加文件内容

#3.close() 关闭压缩文件

#解压文件

#1.ZipFile() 读模式r打开压缩文件

#2.extractall(路径) 解压所有文件到某个路径下

#extract(文件,路径) 解压指定的某个文件到某个路径下

#3.close() 关闭压缩文件

#追加文件(支持with写法)

ZipFile() 追加模式a打开压缩文件

#查看压缩包中的内容

namelist()

zipfile.is_zipfile() 方法

测试filename的文件,看它是否是个有效的zipfile,有效则返回True,否则返回False

import zipfile

(1) 压缩文件

zipfile.ZIP_DEFLATED 压缩减少空间

#创建压缩包

位置实参不能在关键字实参后面,如果compression要省略,mode也要省略

import zipfile

# #创建压缩包
# zf = zipfile.ZipFile("yasuoceshi.zip","w",zipfile.ZIP_DEFLATED)

zf = zipfile.ZipFile("ceshi111.zip","w",  zipfile.ZIP_DEFLATED)
#写入文件,可以一次性将多个文件压缩,打包
write(self, filename, arcname=None, compress_type=None)将指定文件写入ZIP文档中

#参数filename:需要写入文件的路径

#参数arcname:文件写入ZIP文档后保存的文件名

#参数compress_type:压缩方法(ZIP_STORED或ZIP_DEFAULED)


'''write(路径,别名)'''
zf.write("/bin/bash","bash")
zf.write("/bin/bunzip2","bunzip2")
zf.write("/bin/cat","tmp/cat")
#关闭文件
zf.close()

第二个参数是arcname默认参数省略参数名,写上也可以

在Windows查看压缩的文件,log就是info-20230315.log.0 自己起的压缩后的别名 就是参数 arcname 的值

如果不起别名,压缩后的文件,就是源文件包含路径

连续压缩多个文件

(2) 解压文件

解压文件只需要r模式

zf = zipfile.ZipFile(“ceshi111.zip”,“r”)

#解压单个文件

“”“extract(文件,路径)”“”

#第一个参数是之前压缩文件起的别名;第二个参数是要将文件解压到的路径,可以是绝对路径,也可以是相对路径

#zf.extract(“bash”,“ceshi111”)

在Windows查看,解压后的文件,与源文件大小一致,文件名是就是之前起的别名

#解压所有文件,只需要写路径即可

zf.extractall(“ceshi222”)

zf.close()

#解压全部文件 只需要写路径,C:\Users\dell\Desktop\ceshi

在Windows查看解压后的文件,解压成功

(3) 追加文件

zf = zipfile.ZipFile("ceshi111.zip","a", zipfile.ZIP_DEFLATED)
zf.write("/bin/chmod","chmod")
zf.close()

##向压缩包追加文件,追加文件模式用a

追加成功

完整代码:

import zipfile

# #创建压缩包
# zf = zipfile.ZipFile("yasuoceshi.zip","w",zipfile.ZIP_DEFLATED)
# # #写入文件
# # zf.write(r"C:\Users\dell\Desktop\log\info-20230315.log.0","log")
# zf.write(r"C:\Users\dell\Desktop\log\1.log","1.log")
# zf.close()

#解压单个文件
# zf = zipfile.ZipFile("yasuoceshi.zip","r")
# #第一个参数是之前压缩文件起的别名,第二个参数是要将文件解压到的路径
# zf.extract("log",r"C:\Users\dell\Desktop\log")
# zf.close()

#解压全部文件 只需要写路径,C:\Users\dell\Desktop\ceshi
# zf = zipfile.ZipFile("yasuoceshi.zip","r")
# zf.extractall(r"C:\Users\dell\Desktop\ceshi")
# zf.close()


# #向压缩包追加文件,追加文件模式用a
# zf = zipfile.ZipFile("yasuoceshi.zip","a",zipfile.ZIP_DEFLATED)
# # #写入文件
# # zf.write(r"C:\Users\dell\Desktop\log\info-20230315.log.0","log")
# zf.write(r"C:\Users\dell\Desktop\log\1.log","1.log")
# zf.close()

#使用with 来简化操作,压缩解压查看等操作 都可以使用,不用手动关闭
# with zipfile.ZipFile("yasuoceshi.zip","a",zipfile.ZIP_DEFLATED) as zf:
#     zf.write(r"C:\Users\dell\Desktop\log\port-admin.log","port-admin.log")


#查看压缩的文件,返回的是压缩后文件的列表
# with zipfile.ZipFile("yasuoceshi.zip","r") as zf:
#     lst = zf.namelist()
#     print(lst)


(4) 用with来简化操作

with zipfile.ZipFile("ceshi111.zip","a", zipfile.ZIP_DEFLATED) as zf:
    zf.write("/bin/chmod","chmod123456")

如果遇到Permission denied 权限拒绝,可能是压缩包被其他程序打开,关闭即可

(5) 查看文件,返回的是压缩文件的列表

with zipfile.ZipFile("ceshi111.zip","r") as zf:
    lst = zf.namelist()    
    print(lst)


#查看压缩的文件,返回的是压缩后文件的列表


相关文章
|
6月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
821 7
|
6月前
|
监控 安全 程序员
Python日志模块配置:从print到logging的优雅升级指南
从 `print` 到 `logging` 是 Python 开发的必经之路。`print` 调试简单却难维护,日志混乱、无法分级、缺乏上下文;而 `logging` 支持级别控制、多输出、结构化记录,助力项目可维护性升级。本文详解痛点、优势、迁移方案与最佳实践,助你构建专业日志系统,让程序“有记忆”。
540 0
|
6月前
|
JSON 算法 API
Python中的json模块:从基础到进阶的实用指南
本文深入解析Python内置json模块的使用,涵盖序列化与反序列化核心函数、参数配置、中文处理、自定义对象转换及异常处理,并介绍性能优化与第三方库扩展,助你高效实现JSON数据交互。(238字)
586 4
|
7月前
|
安全 大数据 程序员
Python operator模块的methodcaller:一行代码搞定对象方法调用的黑科技
`operator.methodcaller`是Python中处理对象方法调用的高效工具,替代冗长Lambda,提升代码可读性与性能。适用于数据过滤、排序、转换等场景,支持参数传递与链式调用,是函数式编程的隐藏利器。
244 4
|
6月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
678 0
|
6月前
|
XML JSON 数据处理
超越JSON:Python结构化数据处理模块全解析
本文深入解析Python中12个核心数据处理模块,涵盖csv、pandas、pickle、shelve、struct、configparser、xml、numpy、array、sqlite3和msgpack,覆盖表格处理、序列化、配置管理、科学计算等六大场景,结合真实案例与决策树,助你高效应对各类数据挑战。(238字)
877 0
|
7月前
|
存储 数据库 开发者
Python SQLite模块:轻量级数据库的实战指南
本文深入讲解Python内置sqlite3模块的实战应用,涵盖数据库连接、CRUD操作、事务管理、性能优化及高级特性,结合完整案例,助你快速掌握SQLite在小型项目中的高效使用,是Python开发者必备的轻量级数据库指南。
663 0
|
8月前
|
存储 安全 数据处理
Python 内置模块 collections 详解
`collections` 是 Python 内置模块,提供多种高效数据类型,如 `namedtuple`、`deque`、`Counter` 等,帮助开发者优化数据处理流程,提升代码可读性与性能,适用于复杂数据结构管理与高效操作场景。
522 0
|
11月前
|
SQL 安全 算法
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级
Python 3.14 引入了七大核心技术特性,大幅提升开发效率与应用安全性。其中包括:t-strings(PEP 750)提供更安全灵活的字符串处理;类型注解惰性求值(PEP 649)优化启动性能;外部调试器API标准化(PEP 768)增强调试体验;原生支持Zstandard压缩算法(PEP 784)提高效率;REPL交互环境升级更友好;UUID模块扩展支持新标准并优化性能;finally块语义强化(PEP 765)确保资源清理可靠性。这些改进使Python在后端开发、数据科学等领域更具竞争力。
575 5
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级
|
9月前
|
数据安全/隐私保护 Python
抖音私信脚本app,协议私信群发工具,抖音python私信模块
这个实现包含三个主要模块:抖音私信核心功能类、辅助工具类和主程序入口。核心功能包括登录

推荐镜像

更多