Linux VFS中write系统调用实现原理【转】

简介: 转自:http://blog.chinaunix.net/uid-28362602-id-3425881.html 目录 用户空间的write函数在内核里面的服务例程为sys_write Vfs_write函数实现原理   WORD里面的目录复制过来似乎不能直接用。

转自:http://blog.chinaunix.net/uid-28362602-id-3425881.html

目录

用户空间的write函数在内核里面的服务例程为sys_write

Vfs_write函数实现原理

 

WORD里面的目录复制过来似乎不能直接用。。还是放在这里当主线看吧..

 

用户空间的write函数在内核里面的服务例程为sys_write

root@syslab ~]# grep write /usr/include/asm/unistd_64.h

#define __NR_write                              1

__SYSCALL(__NR_write, sys_write)

#define __NR_pwrite64                           18

__SYSCALL(__NR_pwrite64, sys_pwrite64)

#define __NR_writev                             20

__SYSCALL(__NR_writev, sys_writev)

#define __NR_pwritev                            296

__SYSCALL(__NR_pwritev, sys_pwritev)

#define __NR_process_vm_writev                  311

__SYSCALL(__NR_process_vm_writev, sys_process_vm_writev)

 

这里根据经验判断,通常write调用应该是sys_write,这里我们讨论sys_write函数的内核实现

 

SYSCALL_DEFINE3(write, unsigned int, fd, const char __user *, buf,size_t, count)

{

         {//这里SYSCALL_DEFINE3 writesys_write的转换请参看前面的文章Linux 编程中的API函数和系统调用的关系

       //这里unsigned int fd表示用户空间的文件描述符

       //char __user *buf是存放从文件读取内容的一个用户空间内存区

 

         struct file *file;

         ssize_t ret = -EBADF;

         int fput_needed;

 

         file = fget_light(fd, &fput_needed);

         if (file) {

                   loff_t pos = file_pos_read(file);

                   ret = vfs_write(file, buf, count, &pos);

                   file_pos_write(file, pos);

                   fput_light(file, fput_needed);

         }

 

         return ret;

}

可以看到,和sys_read系统调用不同的地方就是这里调用了vfs_write函数来完成写操作,所以这里我们只看vfs_write都做了什么,其余部分请参看Linux read系统调用实现原理

 

Vfs_write函数实现原理

ssize_t  vfs_write(struct file *file, const char __user *buf, size_t count, loff_t *pos)

即把用户空间的char __user* buf指向的内存地址里面的内容写入相应的设备文件

       基本同vfs_read,不过这里变成了

    如果文件系统没有实现file_operation或者既没有实现file_operation->write,也没有实现file_operation->aio_write,则报错。(即文件系统即没有实现同步写,也没有实现异步写,那就报错返回错误了)

如果文件系统实现了file->file_operation->write(还记得我吗在open系统调用中讲到的吗,在open系统调用中file->file_operation设置为了inode->file_operation)函数,则调用它来完成。

否则(说明文件系统没有实现write,但是实现了file_operation->aio_write)调用内核的默认函数do_sync_write(file, buf, count, pos);来做同步读写操作;而内核的do_sync_write函数内部实现是

ssize_t do_sync_write(struct file *filp, const char __user *buf, size_t len, loff_t *ppos){

struct iovec iov = { .iov_base = (void __user *)buf, .iov_len = len };

for (;;) {

                   ret = filp->f_op->aio_write(&kiocb, &iov, 1, kiocb.ki_pos);

                   if (ret != -EIOCBRETRY)

                            break;

                   wait_on_retry_sync_kiocb(&kiocb);

         }

}

这里和do_sync_read不同在于基本也就aio_read换成了aio_write了,do_sync_write最后调用的是file_operation->aio_write方法,但是iov数组长度为1,并且写入过程中如果写入操作没有完成则显式调用进程调度函数,本进程可能被挂起来且进程状态为TASK_UNINTERRUPTIBLE。直到最终写入完成,读取成功后进程状态会变为TASK_RUNNING,且存放在用户空间的buf内存区的内容已经写入硬件上为止

 

具体请参看Linux read系统调用实现原理

【作者】 张昺华
【新浪微博】 张昺华--sky
【twitter】 @sky2030_
【facebook】 张昺华 zhangbinghua
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
目录
相关文章
|
7月前
|
存储 缓存 Linux
Linux VFS机制详解
Linux VFS机制详解
191 1
|
Linux Windows
7.1.8 其他Linux支持的文件系统与VFS
7.1.8 其他Linux支持的文件系统与VFS
84 0
11Linux服务器编程之:VFS虚拟文件系统,dup()函数和dup2()函数
 1dup函数和dup2函数 #include<unistd.h> int dup(intoldfd); int dup2(intoldfd, int newfd);   dup和dup2都可用来复制一个现存的文件描述符,使两个文件描述符指向同一个file结构体。如果两个文件描述符指向同一个file结构体,File Status Fl
1397 0
|
安全 Linux 索引
Linux VFS的主要的数据结构
先说明一下,linux内核中各种数据结构也不停的在变,所以不同版本的内核各个数据结构的定义可能会差别很大,这一组关于linux 文件系统的文章中的代码都摘自linux-2.6.34.1。   VFS依赖于数据结构来保存其对于一个文件系统的一般表示。
1285 0
|
缓存 Linux
《Linux系统编程(第2版)》——2.3 调用write()写
因此,对于普通文件,不需要执行循环写操作。但是,对于其他的文件类型,比如socket,需要循环来保证写了所有请求的字节。使用循环的另一个好处是第二次调用write()可能会返回错误值,说明第一次调用为什么只执行了部分写(虽然这种情况并不常见)。
2315 0
|
2月前
|
Linux 网络安全 数据安全/隐私保护
Linux 超级强大的十六进制 dump 工具:XXD 命令,我教你应该如何使用!
在 Linux 系统中,xxd 命令是一个强大的十六进制 dump 工具,可以将文件或数据以十六进制和 ASCII 字符形式显示,帮助用户深入了解和分析数据。本文详细介绍了 xxd 命令的基本用法、高级功能及实际应用案例,包括查看文件内容、指定输出格式、写入文件、数据比较、数据提取、数据转换和数据加密解密等。通过掌握这些技巧,用户可以更高效地处理各种数据问题。
257 8
|
2月前
|
监控 Linux
如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
本文介绍了在Linux系统中检查内存使用情况的5个常用命令:`free`、`top`、`vmstat`、`pidstat` 和 `/proc/meminfo` 文件,帮助用户准确监控内存状态,确保系统稳定运行。
985 6