初识http协议，简单实现浏览器和服务器通信

2023-08-09 1091

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 初识http协议，简单实现浏览器和服务器通信

认识url

平时俗称的 “网址” 其实就是说的 URL，例如在百度上搜索一个C++

可以看到这段网址前面有个 https 那么这个就代表着使用的是https协议，现在都是使用https协议，不过还是需要认识以下http协议

像 / ? : 等这样的字符, 已经被url当做特殊意义理解了. 因此这些字符不能随意出现。所以在通信的时候需要先对字符进行转义。

比如上面搜索的c++，在网址里就会将 + 转义，转义规则如下：

将需要转码的字符转为16进制，然后从右到左，取4位(不足4位直接处理)，每2位做一位，前面加上%，编码成%XY格式

+的字符码为43，所以转换为16进制为2B。可以通过某些网站来查看转义后的信息，例如：chinaz

那么在http协议中，一串网址各个部分又有什么含义呢，假设现在有这么一串网址

也就是说，网络通信本就是在服务器中找对应的文件资源

http协议格式

了解了网址的意义，那么就来了解一下http协议的格式是什么样的。

通信

那么两端的机器接收到了数据后，怎么样保证读取到一个完整的http协议的数据呢

并不能确保将整个数据读完，但是可以确保将一行读完，因为其中的数据都是由 \r\n 结尾的
所以可以将请求行和请求报头读完，可以发现正文和报文是有空行分割的
一旦读到空行说明请求行和请求报头就读完了
接着报头里可以存放着正文长度的属性，根据正文长度再去读正文即可
响应端同理

那么请求和响应怎么样去序列化和反序列化呢，这个过程有http协议去完成即可

代码验证

验证这个过程只需要将服务端实现即可，客户端用浏览器去进行链接

细节

有时候通过网址去访问服务器时，并不会直接去指明去服务器的哪一个路径找资源，这时候不指明的情况就会默认到服务器的默认路径。例如直接输入 baidu.com 就会跳到百度的首页。因此在编写代码时要加上一个默认的路径

Util.hpp

编写一个工具类，将一些调用的方法放到里面

#pragma once
#include <iostream>
#include <string>
using namespace std;
class Util
{
public:
    // 提取并删除首行
    // 读到的首行并不需要处理
    static string GetOneLine(string &inbuffer, const string &sep)
    {
        auto pos = inbuffer.find(sep);
        if(pos == string::npos)
            return "";
        string sub = inbuffer.substr(0, pos);
        inbuffer.erase(0, sub.size() + sep.size());
        return sub;
    }
};

protocol.hpp

编写请求和响应类

#pragma once
#include <iostream>
#include <string>
#include <sstream>
#include "Util.hpp"
using namespace std;
class HttpRequest
{
public:
    string _inbuffer; // 接收请求数据
    string _method; // 处理数据方法的名称
    string _url; // url
    string _httpversion; //  http协议版本
    string _path; // 查找资源的路径
    HttpRequest(){}
    // 处理收到的数据
    // 添加默认路径
    void parse()
    {
// 定义分隔符
#define sep "\r\n"
#define default_root "./wwwroot"
#define home_page "index.html"
        // 拿到第一行，并删除
        string line = Util::GetOneLine(_inbuffer, sep);
        if(line.empty())
            return;
        cout << "line: " << line << endl;
        // 拿到第一行中的三个字段
        stringstream ss(line);
        ss >> _method >> _url >> _httpversion;
        // 添加默认路径
        _path = default_root;
        _path += _url;
        // 如果url为/ 则添加默认路径
        if(_path[_path.size() - 1] == '/')
            _path += home_page;
    }
};
class HttpResponse
{
public:
    string _outbuffer;
};

Server.hpp

编写服务端

#pragma once
#include "Protocol.hpp"
#include <sys/types.h>
#include <sys/socket.h>
#include <cstring>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <functional>
#include <sys/wait.h>
#include <unistd.h>
using func_t = function<bool(const HttpRequest &, HttpResponse &)>;
class Server
{
public:
    Server(func_t func, uint16_t &port)
        : _port(port), _func(func)
    {
    }
    void Init()
    {
        // 创建负责监听的套接字 面向字节流
        _listenSock = socket(AF_INET, SOCK_STREAM, 0);
        if (_listenSock < 0)
            exit(1);
        // 绑定网络信息
        struct sockaddr_in local;
        memset(&local, 0, sizeof(local));
        local.sin_family = AF_INET;
        local.sin_port = htons(_port);
        local.sin_addr.s_addr = INADDR_ANY;
        if (bind(_listenSock, (struct sockaddr *)&local, sizeof(local)) < 0)
            exit(3);
        // 设置socket为监听状态
        if (listen(_listenSock, 5) < 0)
            exit(4);
    }
    // 服务端读取处理请求方法
    void HttpHandler(int sock)
    {
        // 确保读到完整的http请求
        char buffer[4096];
        size_t n = recv(sock, buffer, sizeof(buffer) - 1, 0);
        HttpRequest req;
        HttpResponse res;
        if (n > 0)
        {
            buffer[n] = 0;
            req._inbuffer = buffer;
            // 处理读到的数据
            req.parse();
            // 调用回调方法反序列化请求并得到响应结果和序列化响应结果
            _func(req, res);
            // 发回客户端
            send(sock, res._outbuffer.c_str(), res._outbuffer.size(), 0);
        }
    }
    void start()
    {
        while (1)
        {
            // server获取建立新连接
            struct sockaddr_in peer;
            memset(&peer, 0, sizeof(peer));
            socklen_t len = sizeof(peer);
            // 创建通信的套接字
            // accept的返回值才是真正用于通信的套接字
            _sock = accept(_listenSock, (struct sockaddr *)&peer, &len);
            if (_sock < 0)
                continue;
            cout << "sock: " << _sock << endl;
            // 利用多进程实现
            pid_t id = fork();
            if (id == 0) // child
            {
                close(_listenSock);
                // 调用方法包括读取、反序列化、计算、序列化、发送
                HttpHandler(_sock);
                close(_sock);
                exit(0);
            }
            close(_sock);
            // father
            pid_t ret = waitpid(id, nullptr, 0);
        }
    }
private:
    int _listenSock; // 负责监听的套接字
    int _sock;       // 通信的套接字
    uint16_t _port;  // 端口号
    func_t _func;
};

Server.cc

#include "Server.hpp"
#include <memory>
// 输出命令错误函数
void Usage(string proc)
{
    cout << "Usage:\n\t" << proc << " local_ip local_port\n\n";
}
// 服务端处理的回调函数
bool func(const HttpRequest &req, HttpResponse &res)
{
    // 打印方便调试查看接收到的数据是否正确
    cout << "---------------http--------------" << endl;
    cout << req._inbuffer;
    cout << "_method: " << req._method << endl;
    cout << " _url: " << req._url << endl;
    cout << " _httpversion: " << req._httpversion << endl;
    cout << " _path: " << req._path << endl;
    cout << "---------------end---------------" << endl;
    // 状态行
    string resline = "HTTP/1.1 200 ok\r\n";
    // 响应报头
    string rescontet = "contet-type: text/html\r\n";
    // 空行
    string resblank = "\r\n";
    // 响应正文：html代码格式，浏览器自动识别
    string body = "<html lang=\"en\"><head><meta charset=\"UTF-8\"><title>My html</title><h1>hello world</h1></head><body><p>这是我的网页</p></body></html>";
    // 写回响应的数据，后续要发送回客户端
    res._outbuffer += resline;
    res._outbuffer += rescontet;
    res._outbuffer += resblank;
    res._outbuffer += body;
    return true;
}
int main(int argc, char *argv[])
{
    // 启动服务端不需要指定IP
    if (argc != 2)
    {
        Usage(argv[0]);
        exit(1);
    }
    uint16_t port = atoi(argv[1]);
    unique_ptr<Server> server(new Server(func, port));
    // 服务端初始化
    server->Init();
    // 服务端启动
    server->start();
    return 0;
}

结果分析

可以看到，用浏览器充当客户端后，浏览器会向服务器发起请求，因为代码里有写了将收到的数据打印，就按照格式将内容打印了出来。

从内容里可以看出客户端的系统和版本。服务端响应后发回数据到浏览器，因为代码中用html的代码去传送，所以浏览器自动识别显示出了网页。

这篇文章主要是将如果能够通信的了，并没有业务逻辑。

初识http协议，简单实现浏览器和服务器通信

认识url

http协议格式

通信

代码验证

细节

Util.hpp

protocol.hpp

Server.hpp

Server.cc

结果分析

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

初识http协议，简单实现浏览器和服务器通信

认识url

http协议格式

通信

代码验证

细节

Util.hpp

protocol.hpp

Server.hpp

Server.cc

结果分析

热门文章

最新文章

相关课程

相关电子书