用 Python 实现一个简易版 HTTP 客户端-阿里云开发者社区

用 Python 实现一个简易版 HTTP 客户端

2023-06-12 603

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 用 Python 实现一个简易版 HTTP 客户端

此文为《用 Python 撸一个 Web 服务器》系列教程的一个补充，这个系列教程介绍了如何使用 Python 内置的 socket 库实现一个简易版的 Web 服务器。

之所以写这篇文章，是因为我发现很多人并不清楚 HTTP 客户端的概念，以为只有浏览器才叫 HTTP 客户端。事实上并非如此，我们在 Web 开发中常见的 Postman、爬虫程序、curl 命令行工具 等，这些都可以称为 HTTP 客户端。

服务器程序示例

这里以一个 Hello World 程序来作为示例服务器，实现如下：

# server.py

import socket

import threading

defprocess_connection(client):

"""处理客户端连接"""

# 接收客户端发来的数据

    data = b''

whileTrue:

        chunk = client.recv(1024)

        data += chunk

if len(chunk) < 1024:

break

# 打印从客户端接收的数据

    print(f'data: {data}')

# 给客户端发送响应数据

    client.sendall(b'HTTP/1.1 200 OK\r\nContent-Type: text/html\r\n\r\n<h1>Hello World</h1>')

# 关闭客户端连接对象

    client.close()

defmain():

# 创建 socket 对象

    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 允许端口复用

    sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)

# 绑定 IP 和端口

    sock.bind(('127.0.0.1', 8000))

# 开始监听

    sock.listen(5)

whileTrue:

# 等待客户端请求

        client, addr = sock.accept()

        print(f'client type: {type(client)}\naddr: {addr}')

# 创建新的线程来处理客户端连接

        t = threading.Thread(target=process_connection, args=(client,))

        t.start()

if __name__ == '__main__':

    main()

服务器端程序不做过多解释，如有不明白的地方可以参考用 Python 撸一个 Web 服务器-第2章：Hello-World 一节。

极简客户端

知道了如何用 socket 库实现服务器端程序，那么理解客户端程序的实现就非常容易了。客户端程序代码实现如下：

# client.py

import socket

# 创建 socket 对象

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 指定服务器 IP 和端口，进行连接

sock.connect(('127.0.0.1', 8000))

# 向 URL "/" 发送 GET 请求

sock.send(b'GET / HTTP/1.1\r\nHost: 127.0.0.1:8000\r\n\r\n')

# 接收服务端响应数据

data = b''

whileTrue:

    chunk = sock.recv(1024)

    data += chunk

if len(chunk) < 1024:

break

# 打印响应数据

print(data)

# 关闭连接

sock.close()

相对来说客户端程序要简单一些，创建 socket 对象的代码与服务器端程序并无差别，客户端 socket 对象根据 IP 和端口来连接指定的服务器，建立好连接后就可以发送数据了，这里根据 HTTP 协议构造了一个针对 / URL 路径的 GET 请求，为了简单起见，请求头中仅携带了 HTTP 协议规定的必传字段 Host，请求发送成功后便可以接收服务器端响应，最后别忘了关闭 socket连接。

仅用几行代码，我们就实现了一个极简的 HTTP 客户端程序，接下来对其进行测试。

首先在终端中使用 Python 运行服务器端程序：python3 server.py。然后在另一个终端中使用 Python 运行客户端程序：python3 client.py。

可以看到客户端打印结果如下：

1	b'HTTP/1.1 200 OK\r\nContent-Type: text/html\r\n\r\n<h1>Hello World</h1>'

以上，我们实现了一个极简的 HTTP 客户端。

参考 `requests` 实现客户端

用 Python 写过爬虫的同学，一定听说或使用过 requests 库，以下是使用 requests 访问 Hello World 服务端程序的示例代码：

# demo_requests.py

import requests

response = requests.request('GET', 'http://127.0.0.1:8000/')

print(response.status_code)  # 响应状态码

print('--------------------')

print(response.headers)  # 响应头

print('--------------------')

print(response.text)  # 响应体

在终端中使用 python3 demo_requests.py 运行此程序，将打印如下结果：

--------------------

{'Content-Type': 'text/html'}

--------------------

<h1>Hello World</h1>

接下来修改我们上面实现的极简 HTTP 客户端程序，使其能够支持 response.status_code、response.headers 和 response.text功能。

# client.py

import socket

from urllib.parse import urlparse

classHTTPClient(object):

"""HTTP 客户端"""

def__init__(self):

# 创建 socket 对象

        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 初始化数据

        self.status_code = 200

        self.headers = {}

        self.text = ''

def__del__(self):

# 关闭连接

        self.sock.close()

defconnect(self, ip, port):

"""建立连接"""

        self.sock.connect((ip, port))

defrequest(self, method, url):

"""请求"""

# URL 解析

        parse_result = urlparse(url)

        ip = parse_result.hostname

        port = parse_result.port or80

        host = parse_result.netloc

        path = parse_result.path

# 建立连接

        self.connect(ip, port)

# 构造请求数据

        send_data = f'{method}{path} HTTP/1.1\r\nHost: {host}\r\n\r\n'.encode('utf-8')

# 发送请求

        self.sock.send(send_data)

# 接收服务端响应的数据

        data = self.recv_data()

# 解析响应数据

        self.parse_data(data)

defrecv_data(self):

"""接收数据"""

        data = b''

whileTrue:

            chunk = self.sock.recv(1024)

            data += chunk

if len(chunk) < 1024:

break

return data.decode('utf-8')

defparse_data(self, data):

"""解析数据"""

        header, self.text = data.split('\r\n\r\n', 1)

        status_line, header = header.split('\r\n', 1)

for item in header.split('\r\n'):

            k, v = item.split(': ')

            self.headers[k] = v

        self.status_code = status_line.split(' ')[1]

if __name__ == '__main__':

    client = HTTPClient()

    client.request('GET', 'http://127.0.0.1:8000/')

    print(client.status_code)

    print('--------------------')

    print(client.headers)

    print('--------------------')

    print(client.text)

代码实现比较简单，我写了较为详细的注释，相信你能够看懂。其中使用了内置函数 urlparse ，此函数能够根据 URL 格式规则将 URL 拆分成多个部分。

在终端中使用 python3 client.py 运行此程序，打印结果与使用 requests 的结果完全相同。

--------------------

{'Content-Type': 'text/html'}

--------------------

<h1>Hello World</h1>

仅用几十行代码，我们就实现了一个简易版的 HTTP 客户端程序，并且还实现了类似 requests 库的功能。

接下来你可以尝试用它去访问现实世界中真实的 URL，比如访问 http://httpbin.org/get，看看打印结果如何。

P.S.

Web 开发本质是围绕着 HTTP 协议进行的，HTTP 协议是 Web 开发的基石。所以对于何为 HTTP 服务端、何为 HTTP 客户端的概念不够清晰的话，实际上都是对 HTTP 协议不够理解。

最后，给大家留一道作业题，实现 requests 库的 response.json() 方法。

用 Python 实现一个简易版 HTTP 客户端

服务器程序示例

极简客户端

参考 `requests` 实现客户端

P.S.

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

用 Python 实现一个简易版 HTTP 客户端

服务器程序示例

极简客户端

参考 requests 实现客户端

P.S.

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

参考 `requests` 实现客户端