《Linux从练气到飞升》No.21 Linux简单实现一个shell-阿里云开发者社区

《Linux从练气到飞升》No.21 Linux简单实现一个shell

2023-12-05 110

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

公共DNS（含HTTPDNS解析），每月1000万次HTTP解析

云解析 DNS，旗舰版 1个月

全局流量管理 GTM，标准版 1个月

简介： 《Linux从练气到飞升》No.21 Linux简单实现一个shell

前言

前面我们讲述了进程的相关知识，包括进程创建、进程等待、进程替换等，这些我们都在Linux上进行了测试，并且通常使用的shell来执行命令，那么我们能不能自己来实现一个简单的shell呢？

我们知道在shell上执行命令时，其原理不过也只是调用和执行文件罢了，也就是创建进程来执行程序，而shell一般是不退出的，那么我们现在开始玩一下

01. 框架搭建

命令行解释器一定是一个常驻内存的进程，不退出，所以我们使用while包起来

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/wait.h>
#include <sys/types.h>
#define NUM 1024
#define SIZE 32
#define SEP " "
//保存完整的命令行字符串
char cmd_line[NUM];
//保存打散之后的命令行字符串
char *g_argv[SIZE];
// 写一个环境变量的buffer，用来测试
char g_myval[64];
// shell 运行原理 ： 通过让子进程执行命令，父进程等待&&解析命令
int main()
{
    extern char**environ;
    //0. 命令行解释器，一定是一个常驻内存的进程，不退出
    while(1)
    {
    }
}

02. 打印提示信息

参考shell的提示信息：

它们都有各自的含义和获取方式，但是这里为了简化，不考虑这些细枝末节，由大家自己改进！

我这里就写死了哦~

我们可以直接使用printf函数打印，但是会有一个问题，如果设置了\n，它会换行，但是我们使用shell时并不会换行，那么我们就需要用到fflush函数来冲刷缓存区。

//1. 打印出提示信息 [venus@localhost myshell]# 
        printf("[root@localhost myshell]# ");
        fflush(stdout);

03. 获取用户键盘输入

如何获取用户在命令行的输入呢？

我们用一个数组来存储命令，使用fgets函数来获取输入

步骤：

先初始化数组
获取存储命令
将最后的回车符号设置为'\0'

//2. 获取用户的键盘输入[输入的是各种指令和选项: "ls -a -l -i"]
        if(fgets(cmd_line, sizeof cmd_line, stdin) == NULL)
        {
            continue;
        }
        cmd_line[strlen(cmd_line)-1] = '\0';

04. 命令行字符串解析

到这一步，我们已经将命令行的字符串存储到数组中了，接下来就是解析它

步骤：

这里要使用strtok函数来裁剪字符串
将存储的命令和系统内部命令做比对，如果有就执行

g_argv[0] = strtok(cmd_line, SEP); //第一次调用，要传入原始字符串
int index = 1;
if(strcmp(g_argv[0], "ls") == 0)
{
    g_argv[index++] = "--color=auto";//加入配色
}
while(g_argv[index++] = strtok(NULL, SEP)); //第二次，如果还要解析原始字符串,传入NULL

05. 创建子进程执行命令

怎么知道要调用的程序在哪里呢？

直接使用进程替换，使用execvp函数，它可以直接使用环境变量不用自己写了，也就是直接掉用系统中的指令的程序来使用即可。

为什么要替换？

一切和应用场景有关，我们有时候必须要让子进程执行新的程序

环境变量相关的数据，会被替换吗？？

没有！它不会被替换，它会把父进程的环境变量拷贝继承过来，它具有全局属性

pid_t id = fork();
if(id == 0) //child
{
    printf("下面功能让子进程进行的\n");
    execvp(g_argv[0], g_argv); // ls -a -l -i
    exit(1);
}
//father
int status = 0;
pid_t ret = waitpid(id, &status, 0);
if(ret > 0) printf("exit code: %d\n", WEXITSTATUS(status));

此时程序基本功能就已经实现了

但是，我们发现一个问题，使用cd命令时，他的路径不会改变，这是个bug

原因是：

在cd的时候，自己写的shell都会执行execvp，它只会影响子进程的路径
但是我们需要改变父进程的路径，所以像cd这种命令，我们不想让子进程去执行它而让父进程去执行它
这种让父进程自己执行的命令叫做内置命令、内建命令，它的本质是shell中的一个函数调用

我们来修改下功能

06. 内置命令 —— cd

这里可以使用chdir函数来实现

chdir函数可以改变文件路径

我们可以使用下面代码，使得cd命令的使用合理，但是可能其他类似的命令也会出现相似的bug，需要一一比对实现，这里仅针对cd命令

if(strcmp(g_argv[0], "cd") == 0) //not child execute, father execute
{
    if(g_argv[1] != NULL) chdir(g_argv[1]); //cd path, cd ..
    continue;
}

07. 内置命令 —— export

上面我们讲了cd的bug，而export也和cd一样，也需要进行处理，export的作用是导入环境变量，我们既不想覆盖父进程的环境变量，又想导入自己的环境变量，该怎么做呢？

代码如下：

//导入环境变量
//比较第一个是不是export
if(strcmp(g_argv[0], "export") == 0 && g_argv[1] != NULL)
{
    strcpy(g_myval, g_argv[1]);//是的就取出后面的值
    int ret = putenv(g_myval);//将它导入环境变量中
    if(ret == 0) printf("%s export success\n", g_argv[1]);//如果导入成功就打印出来
    continue;
}

shell 执行的命令通常有两种

第三方提供的对应的在磁盘中具有二进制文件的可执行程序(由子进程执行)
shell内部自己实现的方法，由自己(父进程)来执行，有些命令就是要影响shell本身，如改变路径的(cd、export)，shell代表的是用户。

shell的环境变量从哪里来的？(了解)

环境变量是写在配置文件中的，shell启动的时候，通过读取配置文件获得的起始环境变量

08. 类似ll这种别名命令无法识别

ll是ls -l的别名

想要支持就要当识别到ll时执行ls命令即可

if(strcmp(g_argv[0], "ll") == 0)
{
    g_argv[0] = "ls";
    g_argv[index++] = "-l";
    g_argv[index++] = "--color=auto";
}

系统中肯定不是这样实现的，但是大致原理相同

后记

最后我们就实现了一个简易的shell解释器

全部代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/wait.h>
#include <sys/types.h>
#define NUM 1024
#define SIZE 32
#define SEP " "
//保存完整的命令行字符串
char cmd_line[NUM];
//保存打散之后的命令行字符串
char *g_argv[SIZE];
// 写一个环境变量的buffer，用来测试
char g_myval[64];
// shell 运行原理 ： 通过让子进程执行命令，父进程等待&&解析命令
int main()
{
    extern char**environ;
    //0. 命令行解释器，一定是一个常驻内存的进程，不退出
    while(1)
    {
        //1. 打印出提示信息 [whb@localhost myshell]# 
        printf("[root@localhost myshell]# ");
        fflush(stdout);
        memset(cmd_line, '\0', sizeof cmd_line);
        //2. 获取用户的键盘输入[输入的是各种指令和选项: "ls -a -l -i"]
        if(fgets(cmd_line, sizeof cmd_line, stdin) == NULL)
        {
            continue;
        }
        cmd_line[strlen(cmd_line)-1] = '\0';
        //3. 命令行字符串解析："ls -a -l -i" -> "ls" "-a" "-i"
        // export myval=105
        g_argv[0] = strtok(cmd_line, SEP); //第一次调用，要传入原始字符串
        int index = 1;
        if(strcmp(g_argv[0], "ls") == 0)
        {
            g_argv[index++] = "--color=auto";
        }
        if(strcmp(g_argv[0], "ll") == 0)
        {
            g_argv[0] = "ls";
            g_argv[index++] = "-l";
            g_argv[index++] = "--color=auto";
        }
        while(g_argv[index++] = strtok(NULL, SEP)); //第二次，如果还要解析原始字符串,传入NULL
        if(strcmp(g_argv[0], "export") == 0 && g_argv[1] != NULL)
        {
            strcpy(g_myval, g_argv[1]);
            int ret = putenv(g_myval);
            if(ret == 0) printf("%s export success\n", g_argv[1]);
            continue;
        }
        //4.内置命令, 让父进程（shell）自己执行的命令，我们叫做内置命令，内建命令
        //内建命令本质其实就是shell中的一个函数调用
        if(strcmp(g_argv[0], "cd") == 0) //not child execute, father execute
        {
            if(g_argv[1] != NULL) chdir(g_argv[1]); //cd path, cd ..
            continue;
        }
        //5. fork()
        pid_t id = fork();
        if(id == 0) //child
        {
            printf("下面功能让子进程进行的\n");
            printf("child, MYVAL: %s\n", getenv("MYVAL"));//测试环境变量
            printf("child, PATH: %s\n", getenv("PATH"));//测试环境变量
            //环境变量相关的数据，会被替换吗？？没有！
            execvp(g_argv[0], g_argv); // ls -a -l -i
            exit(1);
        }
        //father
        int status = 0;
        pid_t ret = waitpid(id, &status, 0);
        if(ret > 0) printf("exit code: %d\n", WEXITSTATUS(status));
    }
}

《Linux从练气到飞升》No.21 Linux简单实现一个shell

前言

01. 框架搭建

02. 打印提示信息

03. 获取用户键盘输入

如何获取用户在命令行的输入呢？

04. 命令行字符串解析

05. 创建子进程执行命令

怎么知道要调用的程序在哪里呢？

为什么要替换？

环境变量相关的数据，会被替换吗？？

06. 内置命令 —— cd

07. 内置命令 —— export

shell 执行的命令通常有两种

shell的环境变量从哪里来的？(了解)

08. 类似ll这种别名命令无法识别

后记

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

《Linux从练气到飞升》No.21 Linux简单实现一个shell

前言

01. 框架搭建

02. 打印提示信息

03. 获取用户键盘输入

如何获取用户在命令行的输入呢？

04. 命令行字符串解析

05. 创建子进程执行命令

怎么知道要调用的程序在哪里呢？

为什么要替换？

环境变量相关的数据，会被替换吗？？

06. 内置命令 —— cd

07. 内置命令 —— export

shell 执行的命令通常有两种

shell的环境变量从哪里来的？(了解)

08. 类似ll这种别名命令无法识别

后记

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像