Python3,9行代码进行压缩和解压缩,从此告别压缩软件。

简介: Python3,9行代码进行压缩和解压缩,从此告别压缩软件。

1、引言


小屌丝:鱼哥,你电脑有没有7-Zip?

小鱼:没有!

小屌丝:winRAR 呢?

小鱼:没有!

小屌丝:360 呢?

小鱼:也没有。

小屌丝:那你如何解压软件?

小鱼:zipfile,tarfile和rarfile。


小屌丝:鱼哥,那你share一下呗

小鱼:晒一晒??

小屌丝:嗯,晒一晒。


2、代码实例


在日常的工作中,我们很多时候都需要对文件/安装软件进行压缩,

但是,由于现在各种各样的压缩、解压缩软件太多,

而有些解压缩软件又不是在正规的(你懂得…),一不小心,就会踩雷。

所以,为了社会的和谐,必要的时候,还可以自己搞几行代码,来对文件进行压缩和解压缩,而今天,我们就来对这三种文件进行压缩和解压缩:


zip文件

tar.gz文件

rar文件

7z文件

2.1 zip文件

说道zip文件压缩和解压缩,小鱼在《Python3:9行代码帮助小姐姐找回压缩包密码,而小姐姐的回报,让我害羞了~ ~》博文详细介绍过解压缩方法。

这里用到的就是ZipFile这个方法。

代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-04-05
# @Author : carl_DJ
import  os
import zipfile
'''
压缩文件
'''
def make_zip(source_path,output_filename):
    zip_file = zipfile.ZipFile(output_filename,'w')
    pre_len = len(os.path.dirname(source_path))
    for parent,dirnames,filenames in os.walk(source_path):
        for filename in filenames:
            print(f'{filename}')
            path_file = os.path.join(parent,filename)
            arcname = path_file[pre_len:].strip(os.path.sep)
            zip_file.write(path_file,arcname)
    zip_file.close()
'''
解压缩文件
'''
def decompression_zip(file_name):
    zip_file = zipfile.ZipFile(file_name)
    if os.path.isdir(file_name + '_files'):
        pass
    else:
        os.mkdir(file_name + '_files')
    for names in zip_file.namelist():
        zip_file.extract(names,file_name + '_files/')
    zip_file.close()
if __name__ == '__main__':
    make_zip(r"D:\phps_pro",'demo_test.zip')
    decompression_zip("demo_test.zip")

2.2 tar.gz文件


2.2.1 基本信息


tarfile 模块可以用来读写 tar 归档,包括使用 gzip, bz2 和 lzma 压缩的归档。

在使用tarfile是必须了解模式:


**mode 必须是 ‘filemode[:compression]’ 形式的字符串,其默认值为 ‘r’,

**,详细参照下表:


image.png

针对特殊的目的,还存在第二种 mode 格式: ‘filemode|[compression]’。

tarfile.open() 将返回一个将其数据作为数据块流来处理的 TarFile 对象:


image.png

2.2.2 代码示例

代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-04-05
# @Author : carl_DJ
import os
import tarfile
import gzip
'''
tar.gz文件  压缩和解压缩
'''
# 一次性打包整个根目录。空子目录会被打包。
# 如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
def make_targz(output_filename, source_dir):
    with tarfile.open(output_filename, "w:gz") as tar:
        tar.add(source_dir, arcname=os.path.basename(source_dir))
# 逐个添加文件打包,未打包空子目录。可过滤文件。
# 如果只打包不压缩,将"w:gz"参数改为"w:"或"w"即可。
def make_targz_one_by_one(output_filename, source_dir):
    tar = tarfile.open(output_filename, "w:gz")
    for root, dir, files in os.walk(source_dir):
        for file in files:
            pathfile = os.path.join(root, file)
            tar.add(pathfile)
    tar.close()
#解压缩gz文件
def decompression_gz(file_name):
    f_name = file_name.replace(".gz", "")
    # 获取文件的名称,去掉
    g_file = gzip.GzipFile(file_name)
    # 创建gzip对象
    open(f_name, "wb+").write(g_file.read())
    # gzip对象用read()打开后,写入open()建立的文件里。
    g_file.close()  # 关闭gzip对象
def decompression_tar(file_name):
    # untar zip file
    tar = tarfile.open(file_name)
    names = tar.getnames()
    if os.path.isdir(file_name + "_files"):
        pass
    else:
        os.mkdir(file_name + "_files")
    # 由于解压后是许多文件,预先建立同名文件夹
    for name in names:
        tar.extract(name, file_name + "_files/")
    tar.close()
if __name__ == '__main__':
    make_targz('test.tar.gz', "D:")
    make_targz_one_by_one('test01.tgz', "D:\phps_pro")
    decompression_tar("demo_test.tar")
    decompression_gz("demo_test.tar.gz")

2.3 rar文件


2.3.1 安装


我们可以使用rarfile来解压.rar的文件,

但是,不支持用rarfile来压缩rar文件。

敲黑板,

因为Python下的 unrar 还依赖了RAR官方的库,所以咱们不能直接pip install unrar,否则会报错。


我们就需要另行安装,Windows为例:


到RARLab官方下载库文件,https://www.rarlab.com/rar/UnRARDLL.exe,然后安装。

安装是最好选择默认路径,一般在 C:Program Files (x86)UnrarDLL 目录下。

添加环境变量,在系统变量中新建变量名UNRAR_LIB_PATH,如果是64位系统,就输入 C:Program Files (x86)UnrarDLLx64UnRAR64.dll,如果是32位系统就是 C:Program Files (x86)UnrarDLLUnRAR.dll。

确定保存环境变量后,在进行 pip install unrar 安装,这时代码再运行就不会报错了。


2.3.2 代码示例


代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-04-05
# @Author : carl_DJ
import rarfile
#解压缩rar
def  decompression_rar(rar_file, dir_name):
  #rarfile需要unrar支持,windows下在winrar文件夹找到unrar,加到path里
  rarobj = rarfile.RarFile(rar_file.decode('utf-8'))
    rarobj.extractall(dir_name.decode('utf-8'))

2.4 7z文件

要压缩和解压缩.7z文件需要用到py7zr组件。


代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-04-05
# @Author : carl_DJ
import py7zr
'''压缩7z'''
with py7zr.SevenZipFile("Archive.7z", 'r') as archive:
    archive.extractall(path="/tmp")
'''解压缩7z'''
with py7zr.SevenZipFile("Archive.7z", 'w') as archive:
    archive.writeall("target/")

3、总结


今天的分享,就到这里了。

奇奇怪怪的知识,又增加了。

以后是不是就不用再去下载第三方的压缩软件了,

直接执行个代码就OK了。


目录
相关文章
|
5月前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
2月前
|
SQL 安全 算法
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级
Python 3.14 引入了七大核心技术特性,大幅提升开发效率与应用安全性。其中包括:t-strings(PEP 750)提供更安全灵活的字符串处理;类型注解惰性求值(PEP 649)优化启动性能;外部调试器API标准化(PEP 768)增强调试体验;原生支持Zstandard压缩算法(PEP 784)提高效率;REPL交互环境升级更友好;UUID模块扩展支持新标准并优化性能;finally块语义强化(PEP 765)确保资源清理可靠性。这些改进使Python在后端开发、数据科学等领域更具竞争力。
108 5
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级
|
19天前
|
数据采集 存储 监控
抖音直播间采集提取工具,直播间匿名截流获客软件,Python开发【仅供学习】
这是一套基于Python开发的抖音直播间数据采集与分析系统,包含观众信息获取、弹幕监控及数据存储等功能。代码采用requests、websockets和sqlite3等...
|
2月前
|
存储 机器学习/深度学习 算法
论上网限制软件中 Python 动态衰减权重算法于行为管控领域的创新性应用
在网络安全与行为管理的学术语境中,上网限制软件面临着精准识别并管控用户不合规网络请求的复杂任务。传统的基于静态规则库或固定阈值的策略,在实践中暴露出较高的误判率与较差的动态适应性。本研究引入一种基于 “动态衰减权重算法” 的优化策略,融合时间序列分析与权重衰减机制,旨在显著提升上网限制软件的实时决策效能。
71 2
|
5月前
|
JavaScript 搜索推荐 Android开发
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
137 8
【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
|
10月前
|
Python
用python转移小文件到指定目录并压缩,脚本封装
这篇文章介绍了如何使用Python脚本将大量小文件转移到指定目录,并在达到大约250MB时进行压缩。
107 2
|
5月前
|
监控 算法 安全
内网桌面监控软件深度解析:基于 Python 实现的 K-Means 算法研究
内网桌面监控软件通过实时监测员工操作,保障企业信息安全并提升效率。本文深入探讨K-Means聚类算法在该软件中的应用,解析其原理与实现。K-Means通过迭代更新簇中心,将数据划分为K个簇类,适用于行为分析、异常检测、资源优化及安全威胁识别等场景。文中提供了Python代码示例,展示如何实现K-Means算法,并模拟内网监控数据进行聚类分析。
120 10
|
6月前
|
存储 算法 安全
控制局域网上网软件之 Python 字典树算法解析
控制局域网上网软件在现代网络管理中至关重要,用于控制设备的上网行为和访问权限。本文聚焦于字典树(Trie Tree)算法的应用,详细阐述其原理、优势及实现。通过字典树,软件能高效进行关键词匹配和过滤,提升系统性能。文中还提供了Python代码示例,展示了字典树在网址过滤和关键词屏蔽中的具体应用,为局域网的安全和管理提供有力支持。
111 17
|
7月前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
159 20
|
7月前
|
存储 缓存 算法
探索企业文件管理软件:Python中的哈希表算法应用
企业文件管理软件依赖哈希表实现高效的数据管理和安全保障。哈希表通过键值映射,提供平均O(1)时间复杂度的快速访问,适用于海量文件处理。在Python中,字典类型基于哈希表实现,可用于管理文件元数据、缓存机制、版本控制及快速搜索等功能,极大提升工作效率和数据安全性。
115 0

推荐镜像

更多