【编程小实验】利用Linux fork()与文件I/O:父进程与子进程协同实现高效cp命令(前半文件与后半文件并行复制)

简介: 这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作

 目录

这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作

技术简单讲解:

创建子进程

进程ID(PID)

资源继承与共享

父子进程的独立性

子进程结束与父进程的责任

实例应用

代码思路:

源码:


这个小程序是在文件IO的基础上去结合父子进程的一个使用,利用父子进程相互独立的特点实现对数据不同的操作

技术简单讲解:

在Linux系统中,进程是执行中的程序实例,每个进程都有其独立的地址空间、资源分配和执行流。当一个进程创建了另一个进程时,前者称为父进程,后者称为子进程。这种关系通过进程间的一种特殊层次结构来体现,是操作系统管理并发执行的基础之一。以下是关于Linux下父子进程的关键概念和操作:

创建子进程

在Linux中,通常使用`fork()`系统调用来创建一个新的子进程。`fork()`调用会产生一个与父进程几乎完全相同的副本(除了进程ID和一些与进程相关的资源标识符),然后在父子进程中分别返回不同的值。在父进程中,`fork()`返回的是子进程的PID(进程ID);而在子进程中,`fork()`返回0。

进程ID(PID)

每个进程都有一个唯一的PID,用于在系统中唯一标识该进程。父进程知道子进程的PID,但反过来不一定,子进程并不直接知道其父进程的PID,但可以通过`getppid()`系统调用获取父进程的PID。

资源继承与共享

子进程继承了父进程的大部分资源,包括但不限于打开的文件描述符、信号处理函数、当前工作目录、用户ID和组ID等。但是,某些资源如内存映射区域可以被标记为“写时复制”(Copy-On-Write, COW),这意味着除非子进程或父进程尝试修改这些资源,否则它们共享同一物理内存,以节省资源。

父子进程的独立性

虽然子进程是从父进程创建的,但一旦创建完成,两者就成为相互独立的实体,各自拥有独立的执行路径、堆栈空间和变量副本。父子进程可以通过IPC(进程间通信)机制如管道、信号、共享内存等进行通信和数据交换。

子进程结束与父进程的责任

当子进程执行完毕或因其他原因终止时,它会变成僵尸状态(Zombie),此时它不再占用任何系统资源,仅保留一个很小的内核记录,包含其PID和退出状态。父进程应该通过`wait()`或`waitpid()`系统调用来收集子进程的退出状态,并释放僵尸进程。如果父进程不这样做,子进程会成为孤儿进程,最终由init进程(PID为1)接管。

实例应用

- **后台服务与前台任务分离**:父进程可以启动子进程处理耗时或后台任务,而自身继续执行其他操作。

- **并发处理**:通过创建多个子进程实现简单的并发执行,提高程序的处理能力和响应速度。

- **一次性任务**:创建子进程执行一次性或有风险的操作,即使子进程崩溃也不会影响父进程的稳定性。

理解并合理运用Linux下的父子进程机制,是编写高效、可靠多任务程序的基础。

代码思路:

利用父子进程特性实现文件分割复制

父子进程特性简介

  • 独立内存空间:父子进程拥有独立的虚拟地址空间,这意味着它们的数据段、堆、栈等都是分离的。
  • 执行顺序:父进程先于子进程执行,子进程是在父进程执行特定系统调用(如fork())后创建的。

文件分割复制策略

要实现文件的分割复制,可以利用上述父子进程特性,通过以下步骤完成:

  1. 文件预处理:使用文件I/O操作打开源文件和目标文件。
  • 开启两个文件,分别用于读取源文件和写入目标文件。
  1. 计算文件大小:读取源文件,统计其总字节数。
  • 可以通过逐字节读取直至遇到文件结束符(EOF)的方式来计算文件大小,或者更高效地使用lseek()fstat()函数。
  1. 父进程操作:复制源文件的前半部分至目标文件。
  • 计算出文件一半的字节数。
  • 使用read()write()系统调用,循环读取并写入数据,直到完成前半部分的复制。
  1. 子进程操作:复制源文件的后半部分至目标文件。
  • 在父进程中调用fork()创建子进程。
  • 子进程使用lseek()将源文件指针移动到文件中间位置。
  • 重复父进程的读写操作,完成剩余数据的复制。

源码:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/stat.h>
#include <string.h>
int main(int argc, char const *argv[])
{
    // 文件IO实现cp 父进程复制前一半 子进程复制后一办
    // 1. 打开文件
    char a[1] = {0};
    int src = open(argv[1], O_RDONLY);
    if (src < 0)
    {
        perror("open error");
        return -1;
    }
    int dest = open(argv[2], O_RDWR | O_CREAT | O_TRUNC, 0666);
    if (dest < 0)
    {
        perror("open error");
        return -1;
    }
    // 2. 计算读取文件的字符个数
    int size = lseek(src, 0, SEEK_END) - lseek(src, 0, SEEK_SET);
    int halfsize = size / 2;
    ssize_t s;
    // 3. 开始打印
    pid_t pid = fork();
    if (pid < 0)
    {
        perror("fork error");
        return -1;
    }
    else if (pid == 0)// 子进程
    {
        lseek(src, l, SEEK_SET);
        lseek(dest, l, SEEK_SET);
        for (int i = 0; i < halfsize; i++)
        {
            s = read(src, a, 1);
            write(dest, a, s);
        }
    }
    else// 父进程
    {
        lseek(src, 0, SEEK_SET);
        lseek(dest, 0, SEEK_SET);
        for (int i = 0; i < halfsize; i++)
        {
            s = read(src, a, 1);
            write(dest, a, s);
        }
    }
    return 0;
}

image.gif


相关文章
|
11月前
|
Linux
【Linux】 Linux文件I/O常见操作技巧
以上就是Linux文件I/O操作的一些技巧,接纳它们,让它们成为你在Linux世界中的得力伙伴,工作会变得轻松许多。不过记住,技巧的运用也需要根据实际情况灵活掌握,毕竟,最适合的才是最好的。
302 28
|
Shell Linux
Linux shell编程学习笔记30:打造彩色的选项菜单
Linux shell编程学习笔记30:打造彩色的选项菜单
|
11月前
|
安全 算法 Ubuntu
Linux(openssl)环境:编程控制让证书自签的技巧。
总结:在Linux环境中,OpenSSL是一个非常实用的工具,可以帮助我们轻松地生成自签名证书。通过上述三个简单步骤,即可为内部网络、测试环境或开发环境创建自签名证书。但在公共访问场景下,建议购买经过权威认证机构签发的证书,以避免安全警告。
533 13
|
JavaScript Ubuntu Linux
如何在阿里云的linux上搭建Node.js编程环境?
本指南介绍如何在阿里云Linux服务器(Ubuntu/CentOS)上搭建Node.js环境,包含两种安装方式:包管理器快速安装和NVM多版本管理。同时覆盖全局npm工具配置、应用部署示例(如Express服务)、PM2持久化运行、阿里云安全组设置及外部访问验证等步骤,助你完成开发与生产环境的搭建。
|
Linux
Linux编程: 在业务线程中注册和处理Linux信号
通过本文,您可以了解如何在业务线程中注册和处理Linux信号。正确处理信号可以提高程序的健壮性和稳定性。希望这些内容能帮助您更好地理解和应用Linux信号处理机制。
270 26
|
Linux
Linux编程: 在业务线程中注册和处理Linux信号
本文详细介绍了如何在Linux中通过在业务线程中注册和处理信号。我们讨论了信号的基本概念,并通过完整的代码示例展示了在业务线程中注册和处理信号的方法。通过正确地使用信号处理机制,可以提高程序的健壮性和响应能力。希望本文能帮助您更好地理解和应用Linux信号处理,提高开发效率和代码质量。
295 17
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
694 13
|
运维 监控 Shell
深入理解Linux系统下的Shell脚本编程
【10月更文挑战第24天】本文将深入浅出地介绍Linux系统中Shell脚本的基础知识和实用技巧,帮助读者从零开始学习编写Shell脚本。通过本文的学习,你将能够掌握Shell脚本的基本语法、变量使用、流程控制以及函数定义等核心概念,并学会如何将这些知识应用于实际问题解决中。文章还将展示几个实用的Shell脚本例子,以加深对知识点的理解和应用。无论你是运维人员还是软件开发者,这篇文章都将为你提供强大的Linux自动化工具。
|
Shell Linux
Linux shell编程学习笔记82:w命令——一览无余
Linux shell编程学习笔记82:w命令——一览无余
下一篇
开通oss服务