文件归档

简介:

一个公司最重要的是什么?当然是公司的数据。数据的安全性就无比重要了,作为管理员数据就是那一个个文件。价值千万的东西在我们手中,我们怎么保护好这些文件,合理划分文件尤为重要。维护这些数据我们的手段都有哪些?linux中内嵌了哪些文档管理工具。

文件查找

       这一节是说归档啊,为什么要先学文件查找。归档前我们要先确定,我们要归档和管理的文件,使用文件查找命令可以快速的帮我们把所需要的文档找出来,方便我们后续的管理。

  1. 一个基于数据库的文件查找工具locat

我们主要使用它来查找系统文件。

既然locat是基于数据库查找的命令,他一定具有一个特点,特别快。同时它支持正则表达式,借用正则表达式的特点,我们可以非常灵活的查找到我们需要的文件。

同时它有一个缺点,它的查找不是实时查找,也是因为它是基于数据库,真是成也数据库败也数据库。构建数据库的命令是updatedb

  1. 实时查找的命令find

他的速度虽然别locat慢,但是它可以实时查找。我们更多的会去选择使用它,因为我们既然要查找文件,那么我们都文件的特性了解的一定不是很清楚,但是了解文件的一部分特性。find就是基于文件一部分特性需找类似文件的工具,生是为我们打造的。

1
2
3
4
5
6
find 的格式:
find  [option]  dirname
option的选项
- type  (f|d|l|c|b|s|p)    指定要查找的文件类型
-size  #[k,m,g,t]         指定文件的大小不指定默认为k。这里举一个例子:
-size [+|-]6m

wKioL1g4I-fzhcHOAAAklV4hqR0606.png-wh_50

      

1
2
3
4
5
6
7
8
-atime  [+|-]       指定访问时间
-mtime[+|-]        指定修改时间
-ctime[+|-]        指定改变时间,它们三个的格式和-size的格式类似
-perm[/|-]         指定权限。/只要有一位权限匹配,该文件就被匹配。-需全部匹配文件才算被匹配。
-userusername        匹配文件用户名
-nouser
-uid                        匹配文件uid
-gid            匹配文件gid

文件压缩

       文件在磁盘里一定是不安全的,因为磁盘会坏,那我们怎么最大程度的保护数据,数据备份。一个硬盘坏了,我们可以多复制几分放在不同的磁盘内。备份数据时,我们一般不会一个个文件的复制,都是把所有要备份的数据保存到一个目录下,然后整体复制走。这就有一个问题了,如果数据量特别大每次备份的压力多大啊。

       嗯,我们有两种备份方式:增量备份和全部备份。

       全部备份,有一个硬伤,数据特别多的时候很难备份。但是比如数据库文件,这个没法采用增量备份,我们只好采用全部备份,但是数据那么多,我们怎么减少数据备份的数量,减少数据的大小压缩文件。

  1. 压缩

Linux中内置了四种压缩方式,每种压缩方式的压缩后的文件后缀名不一样,压缩文件是采用不同的后缀名区分哪些文件是否可以解压。

1
2
3
compress 压缩后的文件的后缀名为.X。压缩后删除文件。
        -d          解压后删除压缩包
        -c          输出到屏幕


gzip压缩后的文件的后缀名是.gz

bzip2压缩后的文件的后缀名是.bz2

1
2
3
4
5
6
7
xz压缩后的文件的后缀名是.xz
        这三个命令的使用格式一致
        -d          解压
        -k          保留原文件
        - #          指定压缩比,默认6
        这四个命令的使用格式是类似的,例如
        Commandname.gz sourcename

文件打包

系统复制零碎文件的速度和复制视频文件的速度,大家都深有体会吧!我们怎么让复制零碎文件具有复制单个文件的速度呢!把文件打包成一个大文件后复制保存。

Linux中的打包命令tarTar的格式

1
2
3
4
5
6
7
8
9
10
Tar <option> name. tar  sourcename
Option的选项
-c                 创建包
-f                  递归
-x                 解包
-g                 创建包的同时,以 gzip 压缩包
-j                  创建包的同时,以bz2压缩包
-J                  创建包的同时,以xz压缩包
Tar命令的简单用法
Tar xf name. tar .[gz|bz2|xz]           直接解压解包


总结

       归档工具很少但是特别强大,归档前寻找数据采用适当的工具,可以快速的定位我们需要的文件,压缩工具已经内嵌到了tar内。

 

遗忘的find的用法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
-name 
-amin
-name  "文件名称" :支持使用glob
*, ?, [], [^]
-iname  "文件名称" :不区分字母大小写
-inum n 按inode号查找
-samefile name 相同inode号的文件
-links n 链接数为n的文件
-regex  "PATTERN" :以PATTERN匹配整个文件路径字符串,而不仅仅是文件名称
- ls :类似于对查找到的文件执行“  ls -l”命令
-delete:删除查找到的文件;
-fls  file :查找到的所有文件的长格式信息保存至指定文件中
-ok COMMAND {} \; 对查找到的每个文件执行由
COMMAND指定的命令;
对于每个文件执行命令之前,都会交互式要求用户确认
- exec  COMMAND {}\; 对查找到的每个文件执行由COMMAND指定的命令
{}: 用于引用查找到的文件名称自身
find 传递查找到的文件至后面指定的命令时,查找到所有符合条件的文件一次性传递给后面的命令
find  | xargsCOMMAND




      本文转自Ailu0li 51CTO博客,原文链接:http://blog.51cto.com/oldking/1876705,如需转载请自行联系原作者






相关文章
|
存储 C语言
C语言实现简易学生信息管理系统
C语言实现简易学生信息管理系统
522 4
|
机器学习/深度学习 搜索推荐 计算机视觉
探索 OOTDiffusion:一个高度可控的虚拟服装试穿开源工具
探索 OOTDiffusion:一个高度可控的虚拟服装试穿开源工具
1294 1
|
9月前
|
存储 分布式计算 Hadoop
Hadoop框架解析:大数据处理的核心技术
组件是对数据和方法的封装,从用户角度看是实现特定功能的独立黑盒子,能够有效完成任务。组件,也常被称作封装体,是对数据和方法的简洁封装形式。从用户的角度来看,它就像是一个实现了特定功能的黑盒子,具备输入和输出接口,能够独立完成某些任务。
|
9月前
|
人工智能 搜索推荐 物联网
GitHub热搜,腾讯黑科技炸场!PhotoMaker:10秒定制真人级头像,百万开发者已疯狂
PhotoMaker 是腾讯 ARC 联合南开大学推出的高效人像生成项目,荣膺 CVPR 2024。支持输入人脸照片与文本描述,秒级生成高保真图像,兼容多种风格与插件,无需额外训练,广泛适用于头像定制、影视后制、虚拟角色创建等场景。
191 1
|
人工智能 自然语言处理 前端开发
100个降噪蓝牙耳机免费领,用通义灵码从 0 开始打造一个完整APP
打开手机,录制下你完成的代码效果,发布到你的社交媒体,前 100 个@玺哥超Carry、@通义灵码的粉丝,可以免费获得一个降噪蓝牙耳机。
6898 16
|
机器学习/深度学习 数据采集 人工智能
容器化机器学习流水线:构建可复用的AI工作流
本文介绍了如何构建容器化的机器学习流水线,以提高AI模型开发和部署的效率与可重复性。首先,我们探讨了机器学习流水线的概念及其优势,包括自动化任务、确保一致性、简化协作和实现CI/CD。接着,详细说明了使用Kubeflow Pipelines在Kubernetes上构建流水线的步骤,涵盖安装、定义流水线、构建组件镜像及上传运行。容器化流水线不仅提升了环境一致性和可移植性,还通过资源隔离和扩展性支持更大规模的数据处理。
|
机器学习/深度学习 人工智能 算法
探索人工智能中的强化学习:原理、算法及应用
探索人工智能中的强化学习:原理、算法及应用
|
机器学习/深度学习 算法 数据可视化
决策树算法介绍:原理与案例实现
决策树算法介绍:原理与案例实现
|
机器学习/深度学习 运维 算法
[ICDE2024]多正常模式感知的频域异常检测算法MACE
阿里云计算平台大数据基础工程技术团队主导,与浙江大学合作的论文《Learning Multi-Pattern Normalities in the Frequency Domain for Efficient Time Series Anomaly Detection》被ICDE2024收录,该论文解决了云服务环境中不同服务存在不同正常模式,而传统神经网络一个训练好的模型只能较好捕捉一种或少数几种正常模式的问题,该论文提出的方法可以使用一个统一模型对不同服务进行检测,就达到比为每一个服务定制一个模型的SOTA方法更好的效果。
|
SQL 数据采集 数据挖掘
Pandas DataFrame 基本操作实例100个
Pandas DataFrame 基本操作实例100个
846 1