探秘Linux网络设计:Reactor模型与高效http静态服务器构建

简介: 本文将深入探讨Linux网络设计中的Reactor模型,并展示如何利用该模型构建高效的http静态服务器。在现代互联网环境中,快速响应和高吞吐量对于提供卓越用户体验至关重要。通过理解Reactor模型的基本概念和工作原理,我们将揭示它在构建高并发应用中的关键作用。本文还将详细介绍如何利用Reactor模型优化网络通信,实现快速的http请求处理和静态资源传输。通过实践经验的分享,包括事件驱动编程、多线程和多进程处理以及负载均衡等技巧,读者将获得构建高效http静态服务器的实际指导和启示。

1、Reactor简介

Reactor意译“反应堆”,是一种事件驱动机制,程序需要提供回调函数,注册到reactor中。
Reactor模型包含三个重要组件:多路复用器,事件分离器,事件处理器。多路复用器在Linux上一般是select、poll、epoll;事件分离器是调用对应注册的回调函数;事件处理器是回调函数的执行,如读、写数据操作。
mermaid-diagram-2023-07-16-123128.png

一个程序监控多个IO,所有要处理的事件注册到一个中心IO多路复用器epoll上,由epoll进行管理,当epoll检测到一个IO事件到来或准备就绪时,epoll触发相对应的IO事件;reactor就是对所有的事件做成反应堆模式,当事件触发时,调用相对应的回调函数。比如,IO的可读事件调用读数据的回调函数,IO的可写事件调用发送数据回调函数。
每个IO相互独立,都有自己相对应的回调函数,互不影响。

2、Reactor存在的理由

1、epoll是对IO的管理,检测接入的IO,触发IO事件;reactor是对事件的管理,不同的事件调用不同的回调函数;这样带来的好处是每个事件对应不同的回调函数,每个事件数据互不影响。
2、事件封装;对未处理的事件放在独立的buffer中;对于http服务器可以优先处理一部分数据。

3、sendfile()说明

在HTTP服务器中,返回资源文件时可以使用sendfile函数来发送body部分,提高效率。
函数原型:

#include <sys/sendfile.h>

ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

说明:
sendfile在一个文件描述符和另一个文件描述符之间复制数据。由于这种复制是在内核中完成的,因此sendfile比读和写的组合更有效,后者需要在用户空间之间传输数据。
参数说明:

参数 含义
out_fd 为读取而打开的文件描述符,通常是文件的fd
in_fd 为写入而打开的文件描述符
out_fd 如果offset不为NULL,则它指向保存文件偏移量的变量,将从该变量开始从infd读取数据。如果偏移量为NULL,则从当前文件偏移量开始从in fd读取数据,并通过调用更新文件偏移量。
count 在文件描述符之间复制的字节数

返回值:
如果传输成功,则返回写入out_ fd的字节数。请注意,成功调用sendfile()可能会写入比请求更少的字节;如果存在未发送的字节,调用方应准备重试调用。传输失败返回负数。

错误代码:

错误码 含义
EAGAIN 已使用ONONBLOCK选择非阻塞I/O,sendfile需要写入阻塞。
EBADF 未打开输入文件进行读取,或未打开输出文件进行写入。
EFAULT 地址不正确。
EINVAL 描述符无效或已锁定,或者类似mmap的操作不可用于in_fd,或者计数为负。
EINVAL out_ fd设置了O_APPEND。sendfile()当前不支持此操作。
EIO 从in_ fd读取时出现未指定错误。
ENOMEM 内存不足,无法从in_ fd读取。
EOVERFLOW 计数太大,该操作将导致超过输入文件或输出文件的最大大小。
ESPIPE 偏移量不为NULL,但输入文件不可搜索(2)。

4、HTTP常用的请求方法

方法 含义
GET 获取资源
POST 提交数据
PUT 更新数据
DELETE 删除数据

5、HTTP静态服务器

HTTP静态服务器可以基于Reactor,实现高并发,reactor的实现可参考上一篇:开启极速之旅:了解Linux网络设计中的Reactor模型与百万级并发实践

5.1 接收数据逻辑 -- recv

HTTP服务器接受请求时,不必接收完所有的数据才进行数据解析,可以读一部分数据先进行解析,再解析后面的数据。
可以按行解析,如HTTP请求时,可以先解析GET方法所在行的数据,里面就包含了请求资源的位置。
mermaid-diagram-2023-07-16-123542.png

5.2 发送数据逻辑 -- send

HTTP服务器返回数据和接收数据的类似,可以先发送http的头数据,再发送内容。
数据拷贝到自己的buffer,发送数据,发送完重新设置事件,设为读就绪。
mermaid-diagram-2023-07-16-123630.png

5.3 HTTP服务器实现

HTTP请求包中GET所在行包含的数据有三部分:请求方法(GET),请求的资源,协议版本号。

5.3.1、HTTP请求包解析

业务分析是recv完之后的操作,一般recv最好是按行读取数据,方便数据分析和处理。
简单示例:

// 读取一行数据
int readline(char *buffer,int idx,char *linebuffer)
{
   
   
    int len=strlen(buffer);
    for(;idx<len;idx++)
    {
   
   
        if(buffer[idx]=='\r' && buffer[idx+1]=='\n')
            return idx+2;
        *(linebuffer++)=buffer[i];
    }
    return  -1;
}

int nty_http_request(struct ntyevent *ev/*用于解析的结构体*/)
{
   
   
    char linebuffer[1024];
    readline(ev->buffer,0,linebuffer);
    if(strstr(linebuffer,"GET "))
    {
   
   
        ev->method=HTTP_METHOD_GET;//标识为HTTP的GET方法
        //解析资源包
        int i = strlen("GET ");
        while (linebuffer[i] != ' ')
            i++;
        linebuffer[i] = '\0';

        sprintf(ev->resource, "%s%s", HTTP_WEB_ROOT,linebuffer + 4);//将请求资源保存
;    }
    else if(strstr(linebuffer,"POST "))
    {
   
   
        /*处理POST方法*/
    }
    return 0;
}

nty_http_request函数在recv之后调用。

5.3.2、HTTP打包发送

HTTP服务器应答需要打包数据,包括HTTP Header和body。在send之前操作,一般将HTTP header和body分开发送。
简单示例:

// http header 打包
int nty_http_response_get_method(struct ntyevent *ev)
{
   
   
    int len;
    int filefd = open(ev->resource, O_RDONLY);
    if (filefd == -1)
    {
   
   
        len = sprintf(ev->wbuffer,
            "HTTP/1.1 200 OK\r\n"
            "Accept-Ranges: bytes\r\n"
            "Content-Length: 78\r\n"
            "Content-Type: text/html\r\n"
            "Date: Sat, 06 Aug 2022 13:16:46 GMT\r\n\r\n"
            "<html><head><title>FLY.TestWeb</title></head><body><h1>FLY.</h1><body/></html>");

        ev->wlength = len;
    }
    else
    {
   
   
        struct stat stat_buf;
        fstat(filefd, &stat_buf);
        close(filefd);
        len = sprintf(ev->wbuffer,
            "HTTP/1.1 200 OK\r\n"
            "Accept-Ranges: bytes\r\n"
            "Content-Length: %ld\r\n"
            "Content-Type: text/html\r\n"
            "Date: Sat, 06 Aug 2022 13:16:46 GMT\r\n\r\n"
            ,stat_buf.st_size);
        ev->wlength = len;
    }
    return len;
}
int nty_http_response(struct ntyevent *ev/*用于解析的结构体*/)
{
   
   
    if(ev->method==HTTP_METHOD_GET)//获取HTTP的请求方法
    {
   
   
        nty_http_response_get_method(ev);//http头打包
    }
    else if(ev->method==HTTP_METHOD_POST)//获取HTTP的请求方法
    {
   
   
    }
}

// 发送数据回调函数
int send_cb(struct ntyevent *ev)
{
   
   
    ......
    send(fd,ev->wbuffer,ev->length,0);//发送http的头数据

    int filefd=open(ev->resource,O_RDONLY);//只读方式打开文件
    struct stat stat_buff;

    // 设置阻塞模式
    fstat(filefd,&stat_buff);
    int flag = fcntl(fd, F_GETFL, 0);
    flag &= ~O_NONBLOCK;
    fcntl(fd, F_SETFL, flag);

    sendfile(filefd,fd,NULL,st_size);// 发送http body

    // 还原非阻塞模式
    flag |= O_NONBLOCK;
    fcntl(fd, F_SETFL, flag);

    close(filefd);

    send(fd, "\r\n", 2, 0);
    ......
}

6 content-type常用类型

参数 含义
text/html HTML格式
application/x-www-form-urlencoded form 表单数据被编码
application/json JSON数据格式
text/plain 纯文本格式
text/xml XML格式
image/gif gif图片格式
image/jpeg jpg图片格式
image/png png图片格式
application/octet-stream 二进制流数据

image.png

相关文章
|
7天前
|
前端开发 JavaScript 开发者
JavaScript:构建动态网络的引擎
JavaScript:构建动态网络的引擎
|
2月前
|
JSON 监控 网络协议
干货分享“对接的 API 总是不稳定,网络分层模型” 看电商 API 故障的本质
本文从 OSI 七层网络模型出发,深入剖析电商 API 不稳定的根本原因,涵盖物理层到应用层的典型故障与解决方案,结合阿里、京东等大厂架构,详解如何构建高稳定性的电商 API 通信体系。
|
7天前
|
机器学习/深度学习 并行计算 算法
【CPOBP-NSWOA】基于豪冠猪优化BP神经网络模型的多目标鲸鱼寻优算法研究(Matlab代码实现)
【CPOBP-NSWOA】基于豪冠猪优化BP神经网络模型的多目标鲸鱼寻优算法研究(Matlab代码实现)
|
7天前
|
人工智能 监控 数据可视化
如何破解AI推理延迟难题:构建敏捷多云算力网络
本文探讨了AI企业在突破算力瓶颈后,如何构建高效、稳定的网络架构以支撑AI产品化落地。文章分析了典型AI IT架构的四个层次——流量接入层、调度决策层、推理服务层和训练算力层,并深入解析了AI架构对网络提出的三大核心挑战:跨云互联、逻辑隔离与业务识别、网络可视化与QoS控制。最终提出了一站式网络解决方案,助力AI企业实现多云调度、业务融合承载与精细化流量管理,推动AI服务高效、稳定交付。
|
17天前
|
机器学习/深度学习 算法 搜索推荐
从零开始构建图注意力网络:GAT算法原理与数值实现详解
本文详细解析了图注意力网络(GAT)的算法原理和实现过程。GAT通过引入注意力机制解决了图卷积网络(GCN)中所有邻居节点贡献相等的局限性,让模型能够自动学习不同邻居的重要性权重。
73 0
从零开始构建图注意力网络:GAT算法原理与数值实现详解
|
1月前
|
弹性计算 安全 Linux
阿里云服务器ECS安装宝塔Linux面板、安装网站(新手图文教程)
本教程详解如何在阿里云服务器上安装宝塔Linux面板,涵盖ECS服务器手动安装步骤,包括系统准备、远程连接、安装命令执行、端口开放及LNMP环境部署,手把手引导用户快速搭建网站环境。
|
1月前
|
算法 安全 网络安全
【多智能体系统】遭受DoS攻击的网络物理多智能体系统的弹性模型预测控制MPC研究(Simulink仿真实现)
【多智能体系统】遭受DoS攻击的网络物理多智能体系统的弹性模型预测控制MPC研究(Simulink仿真实现)
|
2月前
|
JSON 前端开发 Go
Go语言实战:创建一个简单的 HTTP 服务器
本篇是《Go语言101实战》系列之一,讲解如何使用Go构建基础HTTP服务器。涵盖Go语言并发优势、HTTP服务搭建、路由处理、日志记录及测试方法,助你掌握高性能Web服务开发核心技能。
|
2月前
|
Go
如何在Go语言的HTTP请求中设置使用代理服务器
当使用特定的代理时,在某些情况下可能需要认证信息,认证信息可以在代理URL中提供,格式通常是:
227 0
|
2月前
|
监控 Linux 网络安全
FinalShell SSH工具下载,服务器管理,远程桌面加速软件,支持Windows,macOS,Linux
FinalShell是一款国人开发的多平台SSH客户端工具,支持Windows、Mac OS X和Linux系统。它提供一体化服务器管理功能,支持shell和sftp同屏显示,命令自动提示,操作便捷。软件还具备加速功能,提升访问服务器速度,适合普通用户和专业人士使用。
209 0