R语言-文件归档压缩方法

简介: 本文简单分享了一种在 R语言 中压缩文件的实现方法,以供参考学习

1、zip 压缩(推荐使用

zip 格式的优点是系统间的通用性好,能够 逐个压缩多个文件并归档 到一个文件中。zip 格式内提供了包内数据清单,不对 zip 文件解压缩也能高效浏览其中包含的文件条目。压缩率比 gz 略小,一般任务使用无压力,多见于win系统。

utils::zip(zipfile = "file.zip",files = "file")  ### 文件后缀 *.zip

2、gz 压缩

gzip 工具适用于 单文件压缩,多文件的压缩需要提前进行归档将 文件、文件属性和目录结构创建为一个.tar文件,然后压缩 tar 这个文件。对于包含特别多小文件的目录,tar.gz 格式能利用文件之间的冗余信息提高压缩率。多见于 unix/Linux 系统,在这些系统上移植性很高。tar 格式不提供类似zip 的数据清单, 只有充分解压和扫描才能列出包内文件条目。

R.utils::gzip(file_path)  ### 单文件压缩,后缀 *.gz
utils::tar('tmp.tar.gz',"dir_path", compression = 'gzip', tar="tar") ### 多文件归档压缩,*.tar.gz

压缩率测试

Reference

Compression - How are zlib, gzip and zip related? What do they have in common and how are they different? - Stack Overflow

目录
相关文章
|
2月前
|
移动开发 算法 数据可视化
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享(上)
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享
|
2天前
|
Python
R语言遍历文件夹求取其中所有栅格文件的平均值
通过NAvalue(tif_file_all) <- -10000这句代码,将值为-10000的像元作为NoData值的像元,防止后期计算平均值时对结果加以干扰。   接下来,我们通过file.path()函数配置一下输出结果的路径——其中,结果遥感影像文件的名称就可以直接以其所对应的条带号来设置,并在条带号后添加一个_mean后缀,表明这个是平均值的结果图像;但此外,这个仅仅是文件的名字,还需要将文件名与路径拼接在一起,才可以成为完整的保存路径,因此需要用到file.path()函数。最后,将结果图像通过writeRaster()函数加以保存即可,这句代码的解释大家同样参考R语言求取大量遥感
|
2月前
|
数据可视化 算法
【R语言实战】——kNN和朴素贝叶斯方法实战
【R语言实战】——kNN和朴素贝叶斯方法实战
|
2月前
|
数据可视化
R语言机器学习方法分析二手车价格影响因素
R语言机器学习方法分析二手车价格影响因素
|
2月前
|
数据可视化 Python
R语言蒙特卡罗Monte Carlo方法进行数值积分和模拟可视化
R语言蒙特卡罗Monte Carlo方法进行数值积分和模拟可视化
|
2月前
|
机器学习/深度学习 算法 数据库
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
|
2月前
|
算法
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享(下)
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享
|
2月前
|
算法 数据可视化 Windows
R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样(2)
R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样(2)
|
2月前
|
算法 数据挖掘
R语言中的贝叶斯统计方法
【4月更文挑战第26天】R语言在贝叶斯统计中发挥着重要作用,提供如&quot;BUGS&quot;、&quot;Stan&quot;、&quot;JAGS&quot;等包来处理复杂模型和数值计算。贝叶斯方法基于概率论,涉及先验分布、似然函数、后验分布和MCMC模拟。&quot;BUGS&quot;适用于复杂层次模型,&quot;Stan&quot;则在大规模数据和复杂模型上有优势。
|
2月前
|
算法 数据可视化 Python
【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法
【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法

热门文章

最新文章