实验九 proc文件系统的实现
实验目的
掌握虚拟文件系统的实现原理;
实践文件、目录、文件系统等概念。
实验内容
在 Linux 0.11 上实现 procfs(proc 文件系统)内的 psinfo 结点。当读取此结点的内容时,可得到系统当前所有进程的状态信息。例如,用 cat 命令显示 /proc/psinfo 的内容,可得到:
$ cat /proc/psinfo pid state father counter start_time 0 1 -1 0 0 1 1 0 28 1 4 1 1 1 73 3 1 1 27 63 6 0 4 12 817 $ cat /proc/hdinfo total_blocks: 62000; free_blocks: 39037; used_blocks: 22963; ...
procfs 及其结点要在内核启动时自动创建。
相关功能实现在 fs/proc.c 文件内。
procfs介绍
正式的 Linux 内核实现了 procfs,它是一个虚拟文件系统,通常被 mount(挂载) 到 /proc 目录上,通过虚拟文件和虚拟目录的方式提供访问系统参数的机会,所以有人称它为 “了解系统信息的一个窗口”。
这些虚拟的文件和目录并没有真实地存在在磁盘上,而是内核中各种数据的一种直观表示。虽然是虚拟的,但它们都可以通过标准的系统调用(open()、read() 等)访问。
例如,/proc/meminfo 中包含内存使用的信息,可以用 cat 命令显示其内容:
Linux 是通过文件系统接口实现 procfs,并在启动时自动将其 mount 到 /proc 目录上。
此目录下的所有内容都是随着系统的运行自动建立、删除和更新的,而且它们完全存在于内存中,不占用任何外存空间。
Linux 0.11 还没有实现虚拟文件系统,也就是,还没有提供增加新文件系统支持的接口。所以本实验只能在现有文件系统的基础上,通过打补丁的方式模拟一个 procfs。
Linux 0.11 使用的是 Minix 的文件系统,这是一个典型的基于 inode 的文件系统,《注释》一书对它有详细描述。它的每个文件都要对应至少一个 inode,而 inode 中记录着文件的各种属性,包括文件类型。文件类型有普通文件、目录、字符设备文件和块设备文件等。在内核中,每种类型的文件都有不同的处理函数与之对应。我们可以增加一种新的文件类型——proc 文件,并在相应的处理函数内实现 procfs 要实现的功能。
增加新文件类型
文件位置:include/sys/stat.h
#define S_IFPROC 0030000 #define S_ISPROC(m) (((m) & S_IFMT) == S_IFPROC)
让 mknod() 支持新的文件类型
psinfo 结点要通过 mknod() 系统调用建立,所以要让它支持新的文件类型。
if (S_ISBLK(mode) || S_ISCHR(mode) || S_ISPROC(mode)) inode->i_zone[0] = dev;
procfs 的初始化工作
内核初始化的全部工作是在 main() 中完成,而 main() 在最后从内核态切换到用户态,并调用 init()。
init() 做的第一件事情就是挂载根文件系统:
void init(void) { // …… setup((void *) &drive_info); // …… }
procfs 的初始化工作应该在根文件系统挂载之后开始。它包括两个步骤:
(1)建立 /proc 目录;建立 /proc 目录下的各个结点。本实验只建立 /proc/psinfo。
(2)建立目录和结点分别需要调用 mkdir() 和 mknod() 系统调用。因为初始化时已经在用户态,所以不能直接调用 sys_mkdir() 和 sys_mknod()。必须在初始化代码所在文件中实现这两个系统调用的用户态接口,即 API:
static inline _syscall0(int,fork) static inline _syscall0(int,pause) static inline _syscall1(int,setup,void *,BIOS) static inline _syscall0(int,sync) /*新增mkdir和mknode系统调用*/ _syscall2(int,mkdir,const char*,name,mode_t,mode) _syscall3(int,mknod,const char *,filename,mode_t,mode,dev_t,dev) //....... setup((void *) &drive_info); (void) open("/dev/tty0",O_RDWR,0); (void) dup(0); (void) dup(0); mkdir("/proc",0755); mknod("/proc/psinfo",S_IFPROC|0444,0); mknod("/proc/hdinfo",S_IFPROC|0444,1); mknod("/proc/inodeinfo",S_IFPROC|0444,2);
文件目录:init/main.c
mkdir() 时 mode 参数的值可以是 “0755”(对应 rwxr-xr-x),表示只允许 root 用户改写此目录,其它人只能进入和读取此目录。
procfs 是一个只读文件系统,所以用 mknod() 建立 psinfo 结点时,必须通过 mode 参数将其设为只读。建议使用 S_IFPROC|0444 做为 mode 值,表示这是一个 proc 文件,权限为 0444(r–r--r–),对所有用户只读。
mknod() 的第三个参数 dev 用来说明结点所代表的设备编号。对于 procfs 来说,此编号可以完全自定义。proc 文件的处理函数将通过这个编号决定对应文件包含的信息是什么。例如,可以把 0 对应 psinfo,1 对应 meminfo,2 对应 cpuinfo。
如此项工作完成得没有问题,那么编译、运行 0.11 内核后,用 ll /proc 可以看到:
inode->i_mode 就是通过 mknod() 设置的 mode。信息中的 XXX 和你设置的 S_IFPROC 有关。通过此值可以了解 mknod() 工作是否正常。这些信息说明内核在对 hdinfo 进行读操作时不能正确处理,向 cat 返回了 EINVAL 错误。因为还没有实现处理函数,所以这是很正常的。
这些信息至少说明,hdinfo 被正确 open() 了。所以我们不需要对 sys_open() 动任何手脚,唯一要打补丁的,是 sys_read()。