python的压缩模块zipfile详解

简介: python的压缩模块zipfile详解

zipfile

zipfile是python里用来做zip格式编码的压缩和解压缩的 zipfile里有两个非常常用的class,

分别是ZipFile和ZipInfo, 在绝大多数的情况下,我们只需要使用这两个class就可以了。

ZipFile是主要的类,用来创建和读取zip文件。

ZipInfo是存储的zip文件的每个文件的信息的。

#zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])

#ZipFile(路径包名,模式,压缩or打包,可选allowZip64)

#功能:创建一个ZipFile对象,表示一个zip文件.

#参数:

-参数file表示文件的路径或类文件对象(file-like object)

-参数mode指示打开zip文件的模式,默认值为r

r 表示读取已经存在的zip文件

w 表示新建一个zip文档或覆盖一个已经存在的zip文档

a 表示将数据追加到一个现存的zip文档中。

-参数compression表示在写zip文档时使用的压缩方法

zipfile.ZIP_STORED 只是存储模式,不会对文件进行压缩,这个是默认值

zipfile.ZIP_DEFLATED 对文件进行压缩

allowZip64:是个bool型变量,当设置为True的时候就是说可以用来创建大小大于2G的zip文件,默认值是True;

-如果要操作的zip文件大小超过2G,应该将allowZip64设置为True。原码

ZipFile类的常用方法

ZipFile.close(): 关闭文件,结束时必须要有

ZipFile.getinfo(name): 获取zip文档内指定文件的信息。返回一个zipfile.ZipInfo对象,它包括文件的详细信息。

ZipFile.infolist(): 获取zip文档内所有文件的信息,返回一个zipfile.ZipInfo的列表。

ZipFile.namelist(): 获取zip文档内所有文件的名称列表。

ZipFile.extract(member[, path[, pwd]]):将zip文档内的指定文件解压到当前目录。

ZipFile.extractall([path[, members[, pwd]]]): 解压zip文档中的所有文件到当前目录。

ZipFile.printdir(): 将zip文档内的信息打印到控制台上。

ZipFile.setpassword(pwd): 设置zip文档的密码,这个方法我用的时候不好使,暂时没找到问题所在,建议要加密码使用 Python调用linux系统命令加密,或者调用windows里安装的压缩软件加密。

ZipFile.read(name[, pwd]): 获取zip文档内指定文件的二进制数据。

ZipFile.write(filename[, arcname[, compress_type]]):将指定文件添加到zip文档中。

ZipFile.writestr(zinfo_or_arcname, bytes): writestr()支持将二进制数据直接写入到压缩文档。

#压缩文件

#1.ZipFile() 写模式w打开或者新建压缩文件

#2.write(路径,别名) 向压缩文件中添加文件内容

#3.close() 关闭压缩文件

#解压文件

#1.ZipFile() 读模式r打开压缩文件

#2.extractall(路径) 解压所有文件到某个路径下

#extract(文件,路径) 解压指定的某个文件到某个路径下

#3.close() 关闭压缩文件

#追加文件(支持with写法)

ZipFile() 追加模式a打开压缩文件

#查看压缩包中的内容

namelist()

zipfile.is_zipfile() 方法

测试filename的文件,看它是否是个有效的zipfile,有效则返回True,否则返回False

import zipfile

(1) 压缩文件

zipfile.ZIP_DEFLATED 压缩减少空间

#创建压缩包

位置实参不能在关键字实参后面,如果compression要省略,mode也要省略

import zipfile

# #创建压缩包
# zf = zipfile.ZipFile("yasuoceshi.zip","w",zipfile.ZIP_DEFLATED)

zf = zipfile.ZipFile("ceshi111.zip","w",  zipfile.ZIP_DEFLATED)
#写入文件,可以一次性将多个文件压缩,打包
write(self, filename, arcname=None, compress_type=None)将指定文件写入ZIP文档中

#参数filename:需要写入文件的路径

#参数arcname:文件写入ZIP文档后保存的文件名

#参数compress_type:压缩方法(ZIP_STORED或ZIP_DEFAULED)


'''write(路径,别名)'''
zf.write("/bin/bash","bash")
zf.write("/bin/bunzip2","bunzip2")
zf.write("/bin/cat","tmp/cat")
#关闭文件
zf.close()

第二个参数是arcname默认参数省略参数名,写上也可以

在Windows查看压缩的文件,log就是info-20230315.log.0 自己起的压缩后的别名 就是参数 arcname 的值

如果不起别名,压缩后的文件,就是源文件包含路径

连续压缩多个文件

(2) 解压文件

解压文件只需要r模式

zf = zipfile.ZipFile(“ceshi111.zip”,“r”)

#解压单个文件

“”“extract(文件,路径)”“”

#第一个参数是之前压缩文件起的别名;第二个参数是要将文件解压到的路径,可以是绝对路径,也可以是相对路径

#zf.extract(“bash”,“ceshi111”)

在Windows查看,解压后的文件,与源文件大小一致,文件名是就是之前起的别名

#解压所有文件,只需要写路径即可

zf.extractall(“ceshi222”)

zf.close()

#解压全部文件 只需要写路径,C:\Users\dell\Desktop\ceshi

在Windows查看解压后的文件,解压成功

(3) 追加文件

zf = zipfile.ZipFile("ceshi111.zip","a", zipfile.ZIP_DEFLATED)
zf.write("/bin/chmod","chmod")
zf.close()

##向压缩包追加文件,追加文件模式用a

追加成功

完整代码:

import zipfile

# #创建压缩包
# zf = zipfile.ZipFile("yasuoceshi.zip","w",zipfile.ZIP_DEFLATED)
# # #写入文件
# # zf.write(r"C:\Users\dell\Desktop\log\info-20230315.log.0","log")
# zf.write(r"C:\Users\dell\Desktop\log\1.log","1.log")
# zf.close()

#解压单个文件
# zf = zipfile.ZipFile("yasuoceshi.zip","r")
# #第一个参数是之前压缩文件起的别名,第二个参数是要将文件解压到的路径
# zf.extract("log",r"C:\Users\dell\Desktop\log")
# zf.close()

#解压全部文件 只需要写路径,C:\Users\dell\Desktop\ceshi
# zf = zipfile.ZipFile("yasuoceshi.zip","r")
# zf.extractall(r"C:\Users\dell\Desktop\ceshi")
# zf.close()


# #向压缩包追加文件,追加文件模式用a
# zf = zipfile.ZipFile("yasuoceshi.zip","a",zipfile.ZIP_DEFLATED)
# # #写入文件
# # zf.write(r"C:\Users\dell\Desktop\log\info-20230315.log.0","log")
# zf.write(r"C:\Users\dell\Desktop\log\1.log","1.log")
# zf.close()

#使用with 来简化操作,压缩解压查看等操作 都可以使用,不用手动关闭
# with zipfile.ZipFile("yasuoceshi.zip","a",zipfile.ZIP_DEFLATED) as zf:
#     zf.write(r"C:\Users\dell\Desktop\log\port-admin.log","port-admin.log")


#查看压缩的文件,返回的是压缩后文件的列表
# with zipfile.ZipFile("yasuoceshi.zip","r") as zf:
#     lst = zf.namelist()
#     print(lst)


(4) 用with来简化操作

with zipfile.ZipFile("ceshi111.zip","a", zipfile.ZIP_DEFLATED) as zf:
    zf.write("/bin/chmod","chmod123456")

如果遇到Permission denied 权限拒绝,可能是压缩包被其他程序打开,关闭即可

(5) 查看文件,返回的是压缩文件的列表

with zipfile.ZipFile("ceshi111.zip","r") as zf:
    lst = zf.namelist()    
    print(lst)


#查看压缩的文件,返回的是压缩后文件的列表


相关文章
|
2月前
|
SQL 安全 算法
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级
Python 3.14 引入了七大核心技术特性,大幅提升开发效率与应用安全性。其中包括:t-strings(PEP 750)提供更安全灵活的字符串处理;类型注解惰性求值(PEP 649)优化启动性能;外部调试器API标准化(PEP 768)增强调试体验;原生支持Zstandard压缩算法(PEP 784)提高效率;REPL交互环境升级更友好;UUID模块扩展支持新标准并优化性能;finally块语义强化(PEP 765)确保资源清理可靠性。这些改进使Python在后端开发、数据科学等领域更具竞争力。
100 5
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级
|
8月前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
225 62
|
3月前
|
Python
Python教程:os 与 sys 模块详细用法
os 模块用于与操作系统交互,主要涉及夹操作、路径操作和其他操作。例如,`os.rename()` 重命名文件,`os.mkdir()` 创建文件夹,`os.path.abspath()` 获取文件绝对路径等。sys 模块则用于与 Python 解释器交互,常用功能如 `sys.path` 查看模块搜索路径,`sys.platform` 检测操作系统等。这些模块提供了丰富的工具,便于开发中处理系统和文件相关任务。
117 14
|
4月前
|
人工智能 自然语言处理 Shell
[oeasy]python070_如何导入模块_导入模块的作用_hello_dunder_双下划线
本文介绍了如何在Python中导入模块及其作用,重点讲解了`__hello__`模块的导入与使用。通过`import`命令可以将外部模块引入当前环境,增强代码功能。例如,导入`__hello__`模块后可输出“Hello world!”。此外,还演示了如何使用`help()`和`dir()`函数查询模块信息,并展示了导入多个模块的方法。最后,通过一个实例,介绍了如何利用`jieba`、`WordCloud`和`matplotlib`模块生成词云图。总结来说,模块是封装好的功能部件,能够简化编程任务并提高效率。未来将探讨如何创建自定义模块。
62 8
|
4月前
|
缓存 Shell 开发工具
[oeasy]python071_我可以自己做一个模块吗_自定义模块_引入模块_import_diy
本文介绍了 Python 中模块的导入与自定义模块的创建。首先,我们回忆了模块的概念,即封装好功能的部件,并通过导入 `__hello__` 模块实现了输出 "hello world!" 的功能。接着,尝试创建并编辑自己的模块 `my_file.py`,引入 `time` 模块以获取当前时间,并在其中添加自定义输出。
66 5
|
7月前
|
Python
Python Internet 模块
Python Internet 模块。
183 74
|
5月前
|
Python API 监控
将Python CLI工具发布为pip模块的完整指南
注册PyPI账户 访问PyPI官网注册账户 推荐使用双因素认证增强安全性 生成API令牌 访问PyPI账户管理 生成具有"Upload packages"权限的令牌,妥善保存 确保模块名唯一性 在PyPI搜索页面验证模块名未被使用 建议使用小写字母和连字符的组合(如my-cli-tool)
100 9
|
8月前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
199 63
|
8月前
|
Python
Python的模块和包
总之,模块和包是 Python 编程中非常重要的概念,掌握它们可以帮助我们更好地组织和管理代码,提高开发效率和代码质量
179 61
|
8月前
|
数据可视化 Python
如何在Python中解决模块和包的依赖冲突?
解决模块和包的依赖冲突需要综合运用多种方法,并且需要团队成员的共同努力和协作。通过合理的管理和解决冲突,可以提高项目的稳定性和可扩展性

推荐镜像

更多