4.1 打包和压缩的概念和区别

简介: 在讲解具体的归档命令和压缩命令之前,先来了解一下归档和压缩所各自代表的含义。

在讲解具体的归档命令和压缩命令之前,先来了解一下归档和压缩所各自代表的含义。

归档,也称为打包,指的是一个文件或目录的集合,而这个集合被存储在一个文件中。归档文件没有经过压缩,因此,它占用的空间是其中所有文件和目录的总和。

通常,归档总是会和系统(数据)备份联系在一起,不过,有关数据备份的内容,留到后续章节讲,本章仅学习归档命令的基本使用。

和归档文件类似,压缩文件也是一个文件和目录的集合,且这个集合也被存储在一个文件中,但它们的不同之处在于,压缩文件采用了不同的存储方式,使其所占用的磁盘空间比集合中所有文件大小的总和要小。

压缩是指利用算法将文件进行处理,已达到保留最大文件信息,而让文件体积变小的目的。其基本原理为,通过查找文件内的重复字节,建立一个相同字节的词典文件,并用一个代码表示。比如说,在压缩文件中,有不止一处出现了 "C语言中文网",那么,在压缩文件时,这个词就会用一个代码表示并写入词典文件,这样就可以实现缩小文件体积的目的。

由于计算机处理的信息是以二进制的形式表示的,因此,压缩软件就是把二进制信息中相同的字符串以特殊字符标记,只要通过合理的数学计算,文件的体积就能够被大大压缩。把一个或者多个文件用压缩软件进行压缩,形成一个文件压缩包,既可以节省存储空间,有方便在网络上传送。

如果你能够理解文件压缩的基本原理,那么很容易就能想到,对文件进行压缩,很可能损坏文件中的内容,因此,压缩又可以分为有损压缩和无损压缩。无损压缩很好理解,指的是压缩数据必须准确无误;有损压缩指的是即便丢失个别的数据,对文件也不会造成太大的影响。有损压缩广泛应用于动画、声音和图像文件中,典型代表就是影碟文件格式 mpeg、音乐文件格式 mp3 以及图像文件格式 jpg。

采用压缩工具对文件进行压缩,生成的文件称为压缩包,该文件的体积通常只有原文件的一半甚至更小。需要注意的是,压缩包中的数据无法直接使用,使用前需要利用压缩工具将文件数据还原,此过程又称解压缩。

Linux 下,常用归档命令有 2 个,分别是 tar 和 dd(相对而言,tar 的使用更为广泛);常用的压缩命令有很多,比如 gzip、zip、bzip2 等。这些命令的详细用法,后续文件会做一一介绍。

注意,tar 命令也可以作为压缩命令,也很常用。
目录
相关文章
|
7月前
|
JSON 算法 前端开发
2705. 精简对象
2705. 精简对象
56 0
|
7月前
|
存储 安全 Linux
C++文件格式深度解析:从底层结构到关键特性
C++文件格式深度解析:从底层结构到关键特性
443 3
C++文件格式深度解析:从底层结构到关键特性
|
7月前
|
数据库
protobuf 设计,避免频繁打包更新
protobuf 设计,避免频繁打包更新
71 0
|
分布式计算 Hadoop
几种压缩方式及各自优缺点【重点】
几种压缩方式及各自优缺点【重点】
872 0
Cocos2dx的cache细节,资源路径不规范,容易导致cache中存在多份
Cocos2dx的cache细节,资源路径不规范,容易导致cache中存在多份
136 0
|
缓存 Linux 索引
文件相关概念
文件相关概念
143 0
文件相关概念
|
存储 编译器 文件存储
C++语言中多文件组合方式之经典
C++语言中多文件组合方式之经典
241 0
|
JSON 安全 Java
JavaWeb - 深度拷贝方式和性能对比(三)
JavaWeb - 深度拷贝方式和性能对比(三)
515 0
|
Java
JavaWeb - 深度拷贝方式和性能对比(一)
JavaWeb - 深度拷贝方式和性能对比(一)
262 0
|
JSON 安全 NoSQL
JavaWeb - 深度拷贝方式和性能对比(二)
JavaWeb - 深度拷贝方式和性能对比(二)
160 0