1 文件系统的寻址过程——以cat命令是如何读出文件内容、文件的删除过程为例
在操作系统级别看存储空间的话,是分为很多的block块,这些block块是分为很多种类的
当我们使用cat命令查看文件的时候,比如 cat /1.txt ,那么首先会去寻找根目录/,Linux一切皆文件,目录也是文件,根据目录名找到inode编号,然后查看归属信息和权限,是否拥有cat权限,如果有的话再根据指针寻找指向的内容,/的inode block的指针应该是指向/目录的目录块directiry block。然后在/目录的directiry block块中搜索1.txt文件,如果有,找到它的inode号,然后根据1.txt的inode编号找到该文件的inode block,检测归属和权限,如果有权限,则根据指针寻找指针指向,该指针指向的就是文件1.txt的具体内容所在的数据块。这样就可以把文件内容读出来了。
如果我们要删除一个文件的时候,比如删除1.txt,首先在super block中,会把1.txt的inode编号标记为free(自由的),也就是可用的。然后再去该文件所在的目录块(比如/目录)中把a.txt和inode编号1111的映射关系删掉。最后一步,把1.txt的数据所在的数据块标记为free,也就是可用的,如果有其它数据要存储,那么这个block是可以分配的。但是,实际上,block里面的内容还没有被抹去,删除只是删除了寻址的方式和映射关系,真正的文件数据还是保存在block中的。
所以,删除的数据是可以恢复的,首先在super block中把inode1111重新标记为不可分配,然后在directory block中把1.txt和inode1111的映射关系重新建立起来,那么数据就恢复成功了。数据恢复就是一个重新建立关系,打通寻址路径的过程。
文件只有在被覆盖的时候,才算是真正的删除了,也就是有当其他数据正好存在1.txt数据所用的block中时,把原来1.txt文件的内容覆盖掉,这才算是真正的删除。所以说,没有真正的删除,我们没有办法直接把物理硬盘的数据抹去,只能通过删除映射关系,覆盖原数据的方式去删除。(我们看到的磁盘还有多少G空间都是一个逻辑的概念,实际上你的硬盘可能已经全是数据了,只不过有的空间不可用,它保存了你需要的数据,而那些被标记为free状态的block是可用的,即使它上面有数据也是你已经删除不需要的数据,当你保存新数据的时候就会分配一些被标记为free状态的block给你,你的新数据会覆盖掉原来的数据,这样新数据就被保存了。所以,一定要分清楚逻辑的可用空间概念和物理硬盘的概念)
综上,磁盘没有真正的删除操作,只能覆盖。而格式化的过程就是建立文件系统的过程,也就是把各种block块划分出来的过程。
如图,我们用ll命令查看到的信息就是存在18653这个inode block中的
所以,即便是建新文件,磁盘空间也会被占用(虽然没有实际数据,但是会有inode中的信息)
不管是新建还是删除文件,第一步都是找super block,分配编号或者把编号标记为free,第二步去目录中增加或删除映射关系,第三步给文件的inode块关联一个数据块或把关联的数据块标记free。
2 深入探析软链接和硬链接本质
软链接相当于Windows下的快捷方式,修改软链接文件,源文件内容也会改变,修改源文件内容,软链接文件内容随之改变。删除软链接不影响源文件,删除源文件软链接文件失效。
修改硬链接文件,源文件内容也会改变,修改源文件内容,硬链接文件内容随之改变。删除硬链接文件,源文件无影响;删除源文件,硬链接文件无影响。
那么软链接和硬链接这些特性是怎么来的呢?首先我们知道,文件存储分为两部分,一部分是inode block,另一部分是数据block。
软链接是指向文件名的
硬链接是指向inode的
一个分区就是一个文件系统,软链接可以跨分区而硬链接不可以跨分区。
这是因为不同分区可以有相同的文件名,但是inode唯一标识一块block。硬链接是指向inode编号的,假如说我现在有一个1.txt的inode编号为12345,该文件在磁盘分区1上面。我现在在磁盘分区2中创建一个指向inode12345的硬链接文件,这两个12345inode编号指向的是自己分区的block块,这两个block根本就不是同一块磁盘空间。
在操作系统级别,维护的都是inode编号,也就是说操作系统不认文件名,只认inode编号。我们知道,在文件系统中,inode block中有一个指针,软链接的指针就是指向源文件的文件名的。
实际上,在每个目录中都有两个隐藏文件,.是当前目录的硬链接,…是上一级目录的硬链接。