tar之多线程解压缩

简介: tar之多线程解压缩

大家好,我是早九晚十二,目前是做运维相关的工作。写博客是为了积累,希望大家一起进步!

关于tar

我们平常在服务器上操作时,经常会使用到tar命令,这是Unix和类Unix系统上的压缩打包工具,可以将多个文件合并为一个文件,打包后的文件后缀亦为“tar”。它可以在任何用户下使用。
同时,它有多个压缩率不同的版本,如tar.xz和tar.gz,前者的压缩率更高,但可能有兼容性问题。
如果大家使用过tar,一定都会有这个感受:当你在解压或者压缩一个超大文件时,速度会很慢!这是由于tar解压缩操作是用单线程去操作的,如果你在解压的时候,使用top命令,常常会看到某一个cpu飙升到100%。

今天我们就介绍一下,tar的多线程操作。

多线程安装

yum -y install pigz

pigz命令来自于英文词组”parallel implementation of gzip“的缩写,其功能是用于多线程的解压缩文件。与其他解压缩命令不同的是pigz命令支持多线程的并行处理方式,同比gzip能快60%以上,当然CPU的消耗也会更高。

#压缩文件
tar --use-compress-program=pigz -cvpf  app.tar.gz  app

#解压文件
tar --use-compress-program=pigz -xvpf     app.tar.gz

--use-compress-program=pigz即代表使用的pigz工具,那么究竟效果如果呢,我们一起期待一下

结果测试

我们可以编写一个脚本,计算使用pigz和不使用的时间。

#!/bin/bash

echo "starttime: `date +"%Y-%m-%d %H:%M:%S"`" > tar.txt
sleep 5 #在这里填写我们的压缩命令
echo "endtime: `date +"%Y-%m-%d %H:%M:%S"`" >> tar.txt

start=`awk '{print $2,$3}' tar.txt | sed -n '1p'` 
end=`awk '{print $2,$3}' tar.txt | sed -n '2p' `
echo $start
echo $end

starttime={
   
   mathJaxContainer[2]}start" +%s) #转化为系统时间
endtime=$(date  -d "$end"  +%s)
runtime={
   
   mathJaxContainer[4]}endtime-$starttime))  #计算程序运行时间
echo $runtime

单线程压缩

将sleep 5替换为tar -cvpf app.tar.gz app/后执行,输出结果为26s
image.png

多线程压缩

将sleep 5替换为tar --use-compress-program=pigz -cvpf app.tar.gz app后执行,输出结果为15s
image.png

根据以上测试结果,可以看到时间缩短了11s。解压的话,小伙伴们可以自己测试一下。

码字不易,希望大家有用到的可以三连支持一波。哪里有问题的话可以指出,谢谢大家!

相关文章
|
6月前
|
固态存储 Ubuntu Linux
Linux(29) 多线程快速解压缩|删除|监视大型文件
Linux(29) 多线程快速解压缩|删除|监视大型文件
414 1
|
1月前
|
存储 消息中间件 资源调度
C++ 多线程之初识多线程
这篇文章介绍了C++多线程的基本概念,包括进程和线程的定义、并发的实现方式,以及如何在C++中创建和管理线程,包括使用`std::thread`库、线程的join和detach方法,并通过示例代码展示了如何创建和使用多线程。
43 1
C++ 多线程之初识多线程
|
23天前
|
Java 开发者
在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口
【10月更文挑战第20天】在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口。本文揭示了这两种方式的微妙差异和潜在陷阱,帮助你更好地理解和选择适合项目需求的线程创建方式。
17 3
|
23天前
|
Java 开发者
在Java多线程编程中,选择合适的线程创建方法至关重要
【10月更文挑战第20天】在Java多线程编程中,选择合适的线程创建方法至关重要。本文通过案例分析,探讨了继承Thread类和实现Runnable接口两种方法的优缺点及适用场景,帮助开发者做出明智的选择。
16 2
|
23天前
|
Java
Java中多线程编程的基本概念和创建线程的两种主要方式:继承Thread类和实现Runnable接口
【10月更文挑战第20天】《JAVA多线程深度解析:线程的创建之路》介绍了Java中多线程编程的基本概念和创建线程的两种主要方式:继承Thread类和实现Runnable接口。文章详细讲解了每种方式的实现方法、优缺点及适用场景,帮助读者更好地理解和掌握多线程编程技术,为复杂任务的高效处理奠定基础。
28 2
|
23天前
|
Java 开发者
Java多线程初学者指南:介绍通过继承Thread类与实现Runnable接口两种方式创建线程的方法及其优缺点
【10月更文挑战第20天】Java多线程初学者指南:介绍通过继承Thread类与实现Runnable接口两种方式创建线程的方法及其优缺点,重点解析为何实现Runnable接口更具灵活性、资源共享及易于管理的优势。
28 1
|
23天前
|
安全 Java 开发者
Java多线程中的`wait()`、`notify()`和`notifyAll()`方法,探讨了它们在实现线程间通信和同步中的关键作用
本文深入解析了Java多线程中的`wait()`、`notify()`和`notifyAll()`方法,探讨了它们在实现线程间通信和同步中的关键作用。通过示例代码展示了如何正确使用这些方法,并分享了最佳实践,帮助开发者避免常见陷阱,提高多线程程序的稳定性和效率。
33 1
|
23天前
|
Java
在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是线程间通信的核心机制。
在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是线程间通信的核心机制。它们通过基于锁的方式,使线程在条件不满足时进入休眠状态,并在条件成立时被唤醒,从而有效解决数据一致性和同步问题。本文通过对比其他通信机制,展示了 `wait()` 和 `notify()` 的优势,并通过生产者-消费者模型的示例代码,详细说明了其使用方法和重要性。
24 1