【编程小实验】利用Linux fork()与文件I/O:父进程与子进程协同实现高效cp命令(前半文件与后半文件并行复制)

简介: 这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作

 目录

这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作

技术简单讲解:

创建子进程

进程ID(PID)

资源继承与共享

父子进程的独立性

子进程结束与父进程的责任

实例应用

代码思路:

源码:


这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作

技术简单讲解:

在Linux系统中,进程是执行中的程序实例,每个进程都有其独立的地址空间、资源分配和执行流。当一个进程创建了另一个进程时,前者称为父进程,后者称为子进程。这种关系通过进程间的一种特殊层次结构来体现,是操作系统管理并发执行的基础之一。以下是关于Linux下父子进程的关键概念和操作:

创建子进程

在Linux中,通常使用`fork()`系统调用来创建一个新的子进程。`fork()`调用会产生一个与父进程几乎完全相同的副本(除了进程ID和一些与进程相关的资源标识符),然后在父子进程中分别返回不同的值。在父进程中,`fork()`返回的是子进程的PID(进程ID);而在子进程中,`fork()`返回0。

进程ID(PID)

每个进程都有一个唯一的PID,用于在系统中唯一标识该进程。父进程知道子进程的PID,但反过来不一定,子进程并不直接知道其父进程的PID,但可以通过`getppid()`系统调用获取父进程的PID。

资源继承与共享

子进程继承了父进程的大部分资源,包括但不限于打开的文件描述符、信号处理函数、当前工作目录、用户ID和组ID等。但是,某些资源如内存映射区域可以被标记为“写时复制”(Copy-On-Write, COW),这意味着除非子进程或父进程尝试修改这些资源,否则它们共享同一物理内存,以节省资源。

父子进程的独立性

虽然子进程是从父进程创建的,但一旦创建完成,两者就成为相互独立的实体,各自拥有独立的执行路径、堆栈空间和变量副本。父子进程可以通过IPC(进程间通信)机制如管道、信号、共享内存等进行通信和数据交换。

子进程结束与父进程的责任

当子进程执行完毕或因其他原因终止时,它会变成僵尸状态(Zombie),此时它不再占用任何系统资源,仅保留一个很小的内核记录,包含其PID和退出状态。父进程应该通过`wait()`或`waitpid()`系统调用来收集子进程的退出状态,并释放僵尸进程。如果父进程不这样做,子进程会成为孤儿进程,最终由init进程(PID为1)接管。

实例应用

- **后台服务与前台任务分离**:父进程可以启动子进程处理耗时或后台任务,而自身继续执行其他操作。

- **并发处理**:通过创建多个子进程实现简单的并发执行,提高程序的处理能力和响应速度。

- **一次性任务**:创建子进程执行一次性或有风险的操作,即使子进程崩溃也不会影响父进程的稳定性。

理解并合理运用Linux下的父子进程机制,是编写高效、可靠多任务程序的基础。

代码思路:

利用父子进程特性实现文件分割复制

父子进程特性简介

  • 独立内存空间:父子进程拥有独立的虚拟地址空间,这意味着它们的数据段、堆、栈等都是分离的。
  • 执行顺序:父进程先于子进程执行,子进程是在父进程执行特定系统调用(如fork())后创建的。

文件分割复制策略

要实现文件的分割复制,可以利用上述父子进程特性,通过以下步骤完成:

  1. 文件预处理:使用文件I/O操作打开源文件和目标文件。
  • 开启两个文件,分别用于读取源文件和写入目标文件。
  1. 计算文件大小:读取源文件,统计其总字节数。
  • 可以通过逐字节读取直至遇到文件结束符(EOF)的方式来计算文件大小,或者更高效地使用lseek()fstat()函数。
  1. 父进程操作:复制源文件的前半部分至目标文件。
  • 计算出文件一半的字节数。
  • 使用read()write()系统调用,循环读取并写入数据,直到完成前半部分的复制。
  1. 子进程操作:复制源文件的后半部分至目标文件。
  • 在父进程中调用fork()创建子进程。
  • 子进程使用lseek()将源文件指针移动到文件中间位置。
  • 重复父进程的读写操作,完成剩余数据的复制。

源码:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/stat.h>
#include <string.h>
int main(int argc, char const *argv[])
{
    // 文件IO实现cp 父进程复制前一半 子进程复制后一办
    // 1. 打开文件
    char a[1] = {0};
    int src = open(argv[1], O_RDONLY);
    if (src < 0)
    {
        perror("open error");
        return -1;
    }
    int dest = open(argv[2], O_RDWR | O_CREAT | O_TRUNC, 0666);
    if (dest < 0)
    {
        perror("open error");
        return -1;
    }
    // 2. 计算读取文件的字符个数
    int size = lseek(src, 0, SEEK_END) - lseek(src, 0, SEEK_SET);
    int halfsize = size / 2;
    ssize_t s;
    // 3. 开始打印
    pid_t pid = fork();
    if (pid < 0)
    {
        perror("fork error");
        return -1;
    }
    else if (pid == 0)// 子进程
    {
        lseek(src, l, SEEK_SET);
        lseek(dest, l, SEEK_SET);
        for (int i = 0; i < halfsize; i++)
        {
            s = read(src, a, 1);
            write(dest, a, s);
        }
    }
    else// 父进程
    {
        lseek(src, 0, SEEK_SET);
        lseek(dest, 0, SEEK_SET);
        for (int i = 0; i < halfsize; i++)
        {
            s = read(src, a, 1);
            write(dest, a, s);
        }
    }
    return 0;
}

image.gif


相关文章
|
9月前
|
存储 数据管理 Linux
区分Linux中.tar文件与.tar.gz文件的不同。
总之,".tar"文件提供了一种方便的文件整理方式,其归档但不压缩的特点适用于快速打包和解压,而".tar.gz"文件通过额外的压缩步骤,尽管处理时间更长,但可以减小文件尺寸,更适合于需要节约存储空间或进行文件传输的场景。用户在选择时应根据具体需求,考虑两种格式各自的优劣。
1565 13
|
10月前
|
安全 Linux
Linux赋予文件000权限的恢复技巧
以上这些步骤就像是打开一扇锁住的门,步骤看似简单,但是背后却有着严格的逻辑和规则。切记,在任何时候,变更文件权限都要考虑安全性,不要无谓地放宽权限,那样可能
323 16
|
10月前
|
Linux
Linux命令拓展:为cp和mv添加进度显示
好了,就这样,让你的Linux复制体验充满乐趣吧!记住,每一个冷冰冰的命令背后,都有方法让它变得热情起来。
1123 8
|
11月前
|
Linux
【Linux】 Linux文件I/O常见操作技巧
以上就是Linux文件I/O操作的一些技巧,接纳它们,让它们成为你在Linux世界中的得力伙伴,工作会变得轻松许多。不过记住,技巧的运用也需要根据实际情况灵活掌握,毕竟,最适合的才是最好的。
306 28
|
10月前
|
存储 Linux 数据处理
深入剖析Linux中一切即文件的哲学和重定向的机制
在计算机的奇妙世界中,Linux的这套哲学和机制减少了不同类型资源的处理方式,简化了抽象的概念,并蕴藏着强大的灵活性。就像变戏法一样,轻轻松松地在文件、程序与设备之间转换数据流,标准输入、输出、错误流就在指尖舞动,程序的交互和数据处理因此变得既高效又富有乐趣。
177 4
|
11月前
|
安全 算法 Ubuntu
Linux(openssl)环境:编程控制让证书自签的技巧。
总结:在Linux环境中,OpenSSL是一个非常实用的工具,可以帮助我们轻松地生成自签名证书。通过上述三个简单步骤,即可为内部网络、测试环境或开发环境创建自签名证书。但在公共访问场景下,建议购买经过权威认证机构签发的证书,以避免安全警告。
545 13
|
11月前
|
Ubuntu Linux
"unzip"命令解析:Linux下如何处理压缩文件。
总的来说,`unzip`命令是Linux系统下一款实用而方便的ZIP格式文件处理工具。本文通过简明扼要的方式,详细介绍了在各类Linux发行版上安装 `unzip`的方法,以及如何使用 `unzip`命令进行解压、查看和测试ZIP文件。希望本文章能为用户带来实际帮助,提高日常操作的效率。
2621 12
|
10月前
|
Linux
linux文件重命名命令
本指南介绍Linux文件重命名方法,包括单文件操作的`mv`命令和批量处理的`rename`命令。`mv`可简单更改文件名并保留扩展名,如`mv old_file.txt new_name.txt`;`rename`支持正则表达式,适用于复杂批量操作,如`rename &#39;s/2023/2024/&#39; *.log`。提供实用技巧如大小写转换、数字序列处理等,并提醒覆盖风险与版本差异,建议使用`-n`参数预览效果。
Linux部署04-ls命令的参数和选项,主体,参数,选项,ls / 查看根目录下的文件夹,-a的意思是列出全部选项 ls -a home全部文件,.代表着隐藏的文件夹,-l 选项,以列表竖向的形式展
Linux部署04-ls命令的参数和选项,主体,参数,选项,ls / 查看根目录下的文件夹,-a的意思是列出全部选项 ls -a home全部文件,.代表着隐藏的文件夹,-l 选项,以列表竖向的形式展
Linux部署 cd-pwd命令,cd 不写参数 就直接回到用户的HOME目录,pwd 查看当前的工作目录,pwd是常看当前目录的路径,无参数
Linux部署 cd-pwd命令,cd 不写参数 就直接回到用户的HOME目录,pwd 查看当前的工作目录,pwd是常看当前目录的路径,无参数
下一篇
开通oss服务