linux读文件过程-3.10.0-Start From read

简介:

从系统调用read开始,

其系统调用实现如下,传入的参数是打开的文件句柄,用户区缓冲池,读取长度:

SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)

{

        struct fd f = fdget_pos(fd);

        ssize_t ret = -EBADF;

 

        if (f.file) {

                loff_t pos = file_pos_read(f.file);

                ret = vfs_read(f.file, buf, count, &pos);

                if (ret >= 0)

                        file_pos_write(f.file, pos);

                fdput_pos(f);

        }

        return ret;

}

fd是文件描述符是一个整型,对应一个文件,其实是一个索引,关联到一个struct file。

因为入参中是文件描述符,所以需要通过fget_pos(fd)(->fdget->fget_light,current->files)函数来获取file结构体。

fget_pos函数返回的是机构体struct fd,fd的定义如下,包含了file和flags:

struct fd {

        struct file *file;

        unsigned int flags;

};

dae2df2d859fcb434bf3d055510b680d57e9cd87

看到其中调用了vfs_read函数,参数是file,用户层缓冲区和文件偏移位置。

ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)

{

        ssize_t ret;

 

        if (!(file->f_mode & FMODE_READ))

                return -EBADF;

        if (!file->f_op || (!file->f_op->read && !file->f_op->aio_read))

                return -EINVAL;

        if (unlikely(!access_ok(VERIFY_WRITE, buf, count)))

                return -EFAULT;

 

        ret = rw_verify_area(READ, file, pos, count);

        if (ret >= 0) {

                count = ret;

                if (file->f_op->read)

                        ret = file->f_op->read(file, buf, count, pos);

                else

                        ret = do_sync_read(file, buf, count, pos);

                if (ret > 0) {

                        fsnotify_access(file);

                        add_rchar(current, ret);

                }

                inc_syscr(current);

        }

 

        return ret;

}

先是判断,文件的模式是否可读,以及其file_operations结构体中是否定义了read后者aio_read,如果没有则返回。如果成功返回则给进程结构的ioac成员更新io情况。

使用file的f_op函数集,ext4则是结构体ext4_file_operations,定义如下,所以file->f_op->read函数就是do_sync_read函数。

const struct file_operations ext4_file_operations = {

        .llseek         = ext4_llseek,

        .read           = do_sync_read,

        .write          = do_sync_write,

        .aio_read       = generic_file_aio_read,

        .aio_write      = ext4_file_write,

        .unlocked_ioctl = ext4_ioctl,

#ifdef CONFIG_COMPAT

        .compat_ioctl   = ext4_compat_ioctl,

#endif

        .mmap           = ext4_file_mmap,

        .open           = ext4_file_open,

        .release        = ext4_release_file,

        .fsync          = ext4_sync_file,

        .splice_read    = generic_file_splice_read,

        .splice_write   = generic_file_splice_write,

        .fallocate      = ext4_fallocate,

};

如果是xfs文件系统如下:

const struct file_operations xfs_file_operations = {

        .llseek         = xfs_file_llseek,

        .read           = do_sync_read,

        .write          = do_sync_write,

        .aio_read       = xfs_file_aio_read,

        .aio_write      = xfs_file_aio_write,

        .splice_read    = xfs_file_splice_read,

        .splice_write   = xfs_file_splice_write,

        .unlocked_ioctl = xfs_file_ioctl,

#ifdef CONFIG_COMPAT

        .compat_ioctl   = xfs_file_compat_ioctl,

#endif

        .mmap           = xfs_file_mmap,

        .open           = xfs_file_open,

        .release        = xfs_file_release,

        .fsync          = xfs_file_fsync,

        .fallocate      = xfs_file_fallocate,

};

那么,我们进入到了,函数do_sync_read如下:

ssize_t do_sync_read(struct file *filp, char __user *buf, size_t len, loff_t *ppos)

{      

        struct iovec iov = { .iov_base = buf, .iov_len = len };

        struct kiocb kiocb;

        ssize_t ret;

                        

        init_sync_kiocb(&kiocb, filp);

        kiocb.ki_pos = *ppos;

        kiocb.ki_left = len;

        kiocb.ki_nbytes = len;

                       

        ret = filp->f_op->aio_read(&kiocb, &iov, 1, kiocb.ki_pos);

        if (-EIOCBQUEUED == ret)

                ret = wait_on_sync_kiocb(&kiocb);

        *ppos = kiocb.ki_pos;

        return ret;

    do_sync_read函数中会先初始化kiocb(kernel io control block),然后调用f_op->aio_read函数,在ext4中generic_file_aio_read。

    在generic_file_aio_read函数调用generic_segment_checks检测要写的缓冲区是否有效,这种检查在整个内核中都非常常见,如果不做检测很容易导致指针异常而系统崩溃。

    然后判断是否是直接IO,如果是则会调用retval = mapping->a_ops->direct_IO(READ, iocb, iov, pos, nr_segs);

该函数的a_ops是address_space_ops,ext4的如下,其调用的direct_IO是ext4_direct_IO.

static const struct address_space_operations ext4_aops = {

        .readpage               = ext4_readpage,

        .readpages              = ext4_readpages,

        .writepage              = ext4_writepage,

        .writepages             = ext4_writepages,

        .write_begin            = ext4_write_begin,

        .write_end              = ext4_write_end,

        .bmap                   = ext4_bmap,

        .invalidatepage_range   = ext4_invalidatepage,

        .releasepage            = ext4_releasepage,

        .direct_IO              = ext4_direct_IO,

        .migratepage            = buffer_migrate_page,

        .is_partially_uptodate  = block_is_partially_uptodate,

        .error_remove_page      = generic_error_remove_page,

};

     另外xfs的如下:

const struct address_space_operations xfs_address_space_operations = {

        .readpage               = xfs_vm_readpage,

        .readpages              = xfs_vm_readpages,

        .writepage              = xfs_vm_writepage,

        .writepages             = xfs_vm_writepages,

        .set_page_dirty         = xfs_vm_set_page_dirty,

        .releasepage            = xfs_vm_releasepage,

        .invalidatepage_range   = xfs_vm_invalidatepage,

        .write_begin            = xfs_vm_write_begin,

        .write_end              = xfs_vm_write_end,

        .bmap                   = xfs_vm_bmap,

        .direct_IO              = xfs_vm_direct_IO,

        .migratepage            = buffer_migrate_page,

        .is_partially_uptodate  = block_is_partially_uptodate,

        .error_remove_page      = generic_error_remove_page,

};

如果不是,则调用函数do_generic_file_read,从磁盘读取请求的页并把它们复制到用户态缓存区。真正执行读操作,是通过mapping->a_ops->readpage()来完成。

     Address_space对象的readpage会负责激活磁盘到页之间的I/O数据传输。Ext4的readpage函数是ext4_readpage,会调用函数mpage_readpage.如果块在磁盘上是连续的,就用单个bio,如果不连续就用不同的bio描述符来读。

完事之后,由file_read_actor函数负责把页中的数据拷贝到用户态缓冲区中。

     Submit_bio是一个关键函数,负责根据传递的bio实例创建一个新请求。并使用make_request_fn将请求置于驱动程序的请求队列上。

            之后就到块层了,块层会对这些请求进行合并、插入,从而提高性能。

目录
相关文章
|
4月前
|
Linux 开发工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
|
2月前
|
存储 数据管理 Linux
区分Linux中.tar文件与.tar.gz文件的不同。
总之,".tar"文件提供了一种方便的文件整理方式,其归档但不压缩的特点适用于快速打包和解压,而".tar.gz"文件通过额外的压缩步骤,尽管处理时间更长,但可以减小文件尺寸,更适合于需要节约存储空间或进行文件传输的场景。用户在选择时应根据具体需求,考虑两种格式各自的优劣。
245 13
|
3月前
|
安全 Linux
Linux赋予文件000权限的恢复技巧
以上这些步骤就像是打开一扇锁住的门,步骤看似简单,但是背后却有着严格的逻辑和规则。切记,在任何时候,变更文件权限都要考虑安全性,不要无谓地放宽权限,那样可能
101 16
|
3月前
|
存储 Linux 数据处理
深入剖析Linux中一切即文件的哲学和重定向的机制
在计算机的奇妙世界中,Linux的这套哲学和机制减少了不同类型资源的处理方式,简化了抽象的概念,并蕴藏着强大的灵活性。就像变戏法一样,轻轻松松地在文件、程序与设备之间转换数据流,标准输入、输出、错误流就在指尖舞动,程序的交互和数据处理因此变得既高效又富有乐趣。
45 4
|
4月前
|
Linux
【Linux】 Linux文件I/O常见操作技巧
以上就是Linux文件I/O操作的一些技巧,接纳它们,让它们成为你在Linux世界中的得力伙伴,工作会变得轻松许多。不过记住,技巧的运用也需要根据实际情况灵活掌握,毕竟,最适合的才是最好的。
114 28
|
4月前
|
Ubuntu Linux
"unzip"命令解析:Linux下如何处理压缩文件。
总的来说,`unzip`命令是Linux系统下一款实用而方便的ZIP格式文件处理工具。本文通过简明扼要的方式,详细介绍了在各类Linux发行版上安装 `unzip`的方法,以及如何使用 `unzip`命令进行解压、查看和测试ZIP文件。希望本文章能为用户带来实际帮助,提高日常操作的效率。
496 12
|
3月前
|
Linux
linux文件重命名命令
本指南介绍Linux文件重命名方法,包括单文件操作的`mv`命令和批量处理的`rename`命令。`mv`可简单更改文件名并保留扩展名,如`mv old_file.txt new_name.txt`;`rename`支持正则表达式,适用于复杂批量操作,如`rename 's/2023/2024/' *.log`。提供实用技巧如大小写转换、数字序列处理等,并提醒覆盖风险与版本差异,建议使用`-n`参数预览效果。
|
5月前
|
Linux Shell
Linux系统下快速批量创建和删除文件的方法
总的来说,使用shell脚本来批量处理文件是一种非常强大的工具,只要你愿意花时间学习和实践,你会发现它能大大提高你的工作效率。
259 19
|
6月前
|
监控 Linux
Linux基础:文件和目录类命令分析。
总的来说,这些基础命令,像是Linux中藏匿的小矮人,每一次我们使用他们,他们就把我们的指令准确的传递给Linux,让我们的指令变为现实。所以,现在就开始你的Linux之旅,挥动你的命令之剑,探索这个充满神秘而又奇妙的世界吧!
121 19
|
6月前
|
Linux
Linux 常用文件查看命令
`cat` 命令用于连接文件并打印到标准输出,适用于快速查看和合并文本文件内容。常用示例包括:`cat file1.txt` 查看单个文件,`cat file1.txt file2.txt` 合并多个文件,`cat > filename` 创建新文件,`cat >> filename` 追加内容。`more` 和 `less` 命令用于分页查看文件,`tail` 命令则用于查看文件末尾内容,支持实时追踪日志更新,如 `tail -f file.log`。
186 5
Linux 常用文件查看命令