R语言-文件归档压缩方法

简介: 本文简单分享了一种在 R语言 中压缩文件的实现方法,以供参考学习

1、zip 压缩(推荐使用

zip 格式的优点是系统间的通用性好,能够 逐个压缩多个文件并归档 到一个文件中。zip 格式内提供了包内数据清单,不对 zip 文件解压缩也能高效浏览其中包含的文件条目。压缩率比 gz 略小,一般任务使用无压力,多见于win系统。

utils::zip(zipfile = "file.zip",files = "file")  ### 文件后缀 *.zip

2、gz 压缩

gzip 工具适用于 单文件压缩,多文件的压缩需要提前进行归档将 文件、文件属性和目录结构创建为一个.tar文件,然后压缩 tar 这个文件。对于包含特别多小文件的目录,tar.gz 格式能利用文件之间的冗余信息提高压缩率。多见于 unix/Linux 系统,在这些系统上移植性很高。tar 格式不提供类似zip 的数据清单, 只有充分解压和扫描才能列出包内文件条目。

R.utils::gzip(file_path)  ### 单文件压缩,后缀 *.gz
utils::tar('tmp.tar.gz',"dir_path", compression = 'gzip', tar="tar") ### 多文件归档压缩,*.tar.gz

压缩率测试

Reference

Compression - How are zlib, gzip and zip related? What do they have in common and how are they different? - Stack Overflow

目录
相关文章
|
移动开发 算法 数据可视化
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享(上)
【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
328 9
|
数据可视化
R语言机器学习方法分析二手车价格影响因素
R语言机器学习方法分析二手车价格影响因素
|
数据可视化 算法
【R语言实战】——kNN和朴素贝叶斯方法实战
【R语言实战】——kNN和朴素贝叶斯方法实战
|
数据可视化 Python
R语言蒙特卡罗Monte Carlo方法进行数值积分和模拟可视化
R语言蒙特卡罗Monte Carlo方法进行数值积分和模拟可视化
|
机器学习/深度学习 算法 数据库
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
数据分享|R语言用核Fisher判别方法、支持向量机、决策树与随机森林研究客户流失情况
|
算法 数据挖掘
R语言中的贝叶斯统计方法
【4月更文挑战第26天】R语言在贝叶斯统计中发挥着重要作用,提供如"BUGS"、"Stan"、"JAGS"等包来处理复杂模型和数值计算。贝叶斯方法基于概率论,涉及先验分布、似然函数、后验分布和MCMC模拟。"BUGS"适用于复杂层次模型,"Stan"则在大规模数据和复杂模型上有优势。
351 2
|
算法 数据可视化 Windows
R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样(2)
R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样(2)
|
算法 数据可视化 Python
【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法
【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法
|
数据挖掘
R 语言中的模拟和蒙特卡洛方法
【4月更文挑战第25天】本文探讨了R语言中的模拟和蒙特卡洛方法,包括基本原理、应用场景及实际案例。通过随机数生成函数如`runif()`、`rnorm()`,R语言支持构建复杂模拟场景,应用于数值积分、风险评估和统计推断。案例分析展示了股票价格模拟和项目风险评估。掌握这些方法能提升数据分析能力,解决复杂问题,为决策提供支持。
340 1