【Linux】教你用进程替换制作一个简单的Shell解释器

简介: 【Linux】教你用进程替换制作一个简单的Shell解释器

一、观察Shell的运行状态

我们想要制作一个简单的Shell解释器,需要先观察Shell是怎么运行的,根据Shell的运行状态我们再去进行模拟实现。

我们可以先考虑下面的指令与Shell的互动:

我们仔细进行分析可以发现,Shell执行上面的命令时,可以被理解为下面的过程。

当然上面的命令都是普通命令,所以Shell都是通过创建子进程的方式来执行的,对于一些内建命令(Shell自己去执行命令)我们现在还不考虑,在后面的部分我们再进行进一步的讨论内建命令应该怎么去处理。

二、简单的Shell解释器制作原理

通过观察Shell的运行状态,我们知道然后Shell读取新的一行输入,建立一个新的子进程,在这个子进程中运行程序并等待这个进程结束。

所以要写一个shell,需要循环以下过程:

  1. 获取命令行
  2. 解析命令行
  3. 建立一个子进程(fork
  4. 替换子进程(execvp),执行替换后的程序
  5. 父进程等待子进程退出(wait

1、获取命令行

我们在在Shell中输入的命令本质上就是输入一个字符串,因此我们想要获取命令行,可以先创建一个字符数组commandstr,然后使用C语言的fgets函数从键盘中进行读取数据到字符数组里面,这样我们就获取了一个命令行了。

注意:

  1. 这里不能使用scanf函数 ,这里的命令会包含空格,会导致scanf读取不到完整的数据。
  2. fgets函数会将我们输入的命令时的最后一个的\n符也给读取到字符数组内,我们需要特殊处理将\n进行用\0进行覆盖
//这里包含的头文件是我们整个程序需要用到的所有头文件
#include<stdio.h>
#include<unistd.h>
#include<assert.h>
#include<string.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<stdlib.h>
//这里的N用于定义字符数组的大小
#define N 128
int main()
{
  //存储命令行的字符数组
  char commandstr[N] = "";
  //Shell要一直运行接受命令,所以这里必须是死循环!
  while(1)
  {
    //模拟Shell的提示符
    printf("[hong@machine MiniShell]# ");
    //从标准输入流中读取字符串
    char* s = fgets(commandstr, sizeof(commandstr), stdin);
    assert(s); //判断fgets是否读取成功
    //处理\n   示例字符串:ls -a -l\n\0
    commandstr[strlen(commandstr) - 1] = '\0';
   }

2、解析命令行

虽然我们通过前一步已经拿到命令行,但是我们还不能直接使用,因为我们拿到的字符串中间可能有许多空格以及一些其他的问题,我们还需要将命令行的字符进行切割提取出我们想要的子串,这样才符合程序替换函数的要求。例如:将 ls -a -l提取成 ls ,-a , -l

对于字符串的切割,我们可以使用C语言提供的strtok函数,由于切割以后我们的字符串从一个变成了多个,因此我们需要用一个字符串指针数组argv,存储每一部分切割后的首地址,同时这个argv也可以直接传递给execvp函数进行程序替换了。

//在全局域中 定义切割符
#define SEP " "
//main函数的外部 定义一个命令行切割函数
int split(char commandstr[], char* argv[])
{
  assert(commandstr);
  assert(argv);
  //第一次切割
  argv[0] = strtok(commandstr, SEP);
  if(argv[0] == NULL)
  {
    //返回 -1表示异常退出
    return -1; 
  }
  //循环切割
  int i = 1;
  while((argv[i++] = strtok(NULL, SEP)));
  return 0;
}
//main函数内部,while循环上面定义切割后的字符指针数组
char* argv[N] ={NULL};
//while循环内部
  //切割字符串  例如将"ls -a -l " 变为 "ls" "-a" "-l"
    int n = split(commandstr, argv);
    if(n == -1)
    {
      //切割失败就终止本次循环
      continue;
    }

3、创建子进程 进行程序替换 父进程等待

创建子进程而我们可以使用fork函数进行创建,创建完以后进程的执行流由一个变成了两个,我们在子进程中进行程序替换可以使用execvp命令,同时我们的argv[0]就是程序名,argv中存储的就是命令按照什么方式进行执行。

最后我们的父进程可以在外面进行阻塞等待,然后获取子进程的退出码和退出信息。

//main函数内部,while循环上面定义退出码变量
 int last_status = 0;
//while循环内部
//创建子进程,进行命令处理
    pid_t id = fork();
    assert(id >= 0);
    if(id == 0)
    {
      //child process
      execvp(argv[0], argv);  
      //如果执行到这里说明程序替换失败  
      exit(-1);
    }
  //父进程等待子进程
    int status;
    int pid = waitpid(id, &status, 0); 
    //等待成功就提取退出码信息
    if(pid >= 0)
    {
      last_status = WEXITSTATUS(status);
    }
  }
  return 0;

4、实际运行

我们可以执行 lspwdps -axj命令 看一看效果。

二、对简单的内建命令进行处理

我们知道内建命令是让Shell自己执行的命令,而不是让子进程执行的命令,例如cd命令就是内建命令,因为我们要改变的是Shell自己的工作目录,而不是子进程的工作目录,类似的命令还有exportenvecho命令。

由于上面我们写的程序执行命令时都是交给子进程去做的,所以我们上面写的程序是没有办法执行内建命令的,或者说能执行内建命令,但不是我们想要的结果或目的。

所以接下来我们要对这个简单的Shell进行改造,让它能够执行一些简单的内建命令,还有刚刚我们的ls命令没有色彩,我们也要进行一些修改。

1、给ls命令加上色彩

在真正的Shell中我们执行的ls命令其实是ls --color=autols被我们真正的Shell进行了起别名。

我们在运行我们自己制作的Shell时也可以加上--color=auto

//此段代码应该在切割字符串之后
//argv[0]就是我们的命令名
if(strcmp(argv[0], "ls") == 0)
    {
      int pos = 0;
      //寻找指针数组的结尾
      while(argv[pos++]);
      //在NULL位置加上 --color=auto
      argv[pos - 1] = "--color=auto";
      //将后一个位置置空
      argv[pos] = NULL;
    }

这样以后我们在我们自己制作的Shell中执行ls命令时也会由颜色了!

2、支持cd命令

对于cd命令如果让父进程进行执行,我们可以调用系统调用chdir我们只需要传递一个参数:路径字符串,当执行成功时会返回0,执行失败会返回-1,并设置错误码。

//此段代码应该在ls添加颜色之后
else if(strcmp(argv[0], "cd") == 0)
    {
      //argv[1]里面存放的是路径字符串
      if(argv[1] == NULL)
      {
        printf("没有正确的路径!\n");
        //设置错误码
        last_status = -1;
        continue;
      }
        //执行系统调用改变父进程的工作目录
        chdir(argv[1]);
        continue;
    }

3、支持export命令

export命令可以将一个本地变量加入到环境变量表中,我们让我们自己制作的Shell完成expoprt命令可以用C语言提供的函数putenv函数,但是在向环境变量表加入新的环境变量时,我们要维护好我们加入到环境变量,这个环境变量不能够被轻易的覆盖,否则环境变量表在找我们的环境变量时就会找不到,所以我们还要创建一个我们自己维护的二维数组。

//在全局域中定义
// 自己维护的二维数组最多能向环境变量表几个自定义的环境变量
#define MAX 64
//main函数内部,while循环上面定义
//指向下一个要添加的环境变量的位置
 int env_index = 0;
//要维护的二维数组
 char envstr[MAX][N];
//此段代码应该在ls添加颜色之后
 else if(strcmp(argv[0], "export") == 0)
    {
    //声明putenv函数否则会编译器会有警告
      extern int putenv(char *string); 
      //argv[1]位置应该是环境变量
      if(argv[1] == NULL)
      {
        printf("没有输入变量!\n");
        last_status = -1;
        continue;
      }
      //将argv[1]位置的环境变量,拷贝到env_str中,否则下一次解析的命令会覆盖环境变量
      strcpy(envstr[env_index], argv[1]);
      //将环境变量导入环境变量表
      putenv(envstr[env_index++]);
    }

4、支持env命令

对于env命令我们只需要写一个打印环境变量表的函数就能完成此命令了。

//main函数的外部 定义一个打印环境变量表的函数
void showEnv()
{
  extern char** environ;
  int i = 0;
  while(environ[i])
  {
    printf("%d : %s\n", i, environ[i++]);
  }
}
//此段代码应该在ls添加颜色之后
 else if(strcmp(argv[0], "env") == 0)
    {
      showEnv();
      continue;
    }

5、支持echo命令

echo命令可以用于打印环境变量,也可以打印退出码,这取决于$后面是不是??我们就可以打印last_status,不是我们就用getenv命令拿到环境变量的内容。

//此段代码应该在ls添加颜色之后
else if(strcmp(argv[0], "echo") == 0)
    {
      if(*argv[1] == '$')
      {
        if(*(argv[1] + 1) == '?')
        {
          printf("process exit code %d\n", last_status);
          continue;
        }
        else
        {
          char* str = getenv(argv[1] + 1);
          printf("%s\n",str);
          continue;
        }
      }
    }
相关文章
|
1月前
|
资源调度 Linux 调度
Linux c/c++之进程基础
这篇文章主要介绍了Linux下C/C++进程的基本概念、组成、模式、运行和状态,以及如何使用系统调用创建和管理进程。
37 0
|
17天前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
51 4
linux进程管理万字详解!!!
|
8天前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
48 8
|
5天前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?
|
17天前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
52 4
|
18天前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
1月前
|
Web App开发 网络协议 Linux
linux命令总结(centos):shell常用命令汇总,平时用不到,用到就懵逼忘了,于是专门写了这篇论文,【便持续更新】
这篇文章是关于Linux命令的总结,涵盖了从基础操作到网络配置等多个方面的命令及其使用方法。
64 1
linux命令总结(centos):shell常用命令汇总,平时用不到,用到就懵逼忘了,于是专门写了这篇论文,【便持续更新】
|
19天前
|
消息中间件 存储 Linux
|
23天前
|
运维 监控 Shell
深入理解Linux系统下的Shell脚本编程
【10月更文挑战第24天】本文将深入浅出地介绍Linux系统中Shell脚本的基础知识和实用技巧,帮助读者从零开始学习编写Shell脚本。通过本文的学习,你将能够掌握Shell脚本的基本语法、变量使用、流程控制以及函数定义等核心概念,并学会如何将这些知识应用于实际问题解决中。文章还将展示几个实用的Shell脚本例子,以加深对知识点的理解和应用。无论你是运维人员还是软件开发者,这篇文章都将为你提供强大的Linux自动化工具。
|
26天前
|
运维 Linux
Linux查找占用的端口,并杀死进程的简单方法
通过上述步骤和命令,您能够迅速识别并根据实际情况管理Linux系统中占用特定端口的进程。为了获得更全面的服务器管理技巧和解决方案,提供了丰富的资源和专业服务,是您提升运维技能的理想选择。
31 1
下一篇
无影云桌面