Python网络编程:HTTP请求(requests模块)

简介: 在现代编程中,HTTP请求几乎无处不在。无论是数据抓取、API调用还是与远程服务器进行交互,HTTP请求都是不可或缺的一部分。在Python中,requests模块被广泛认为是发送HTTP请求的最简便和强大的工具之一。本文将详细介绍requests模块的功能,并通过一个综合示例展示其应用。

在现代编程中,HTTP请求几乎无处不在。无论是数据抓取、API调用还是与远程服务器进行交互,HTTP请求都是不可或缺的一部分。在Python中,requests模块被广泛认为是发送HTTP请求的最简便和强大的工具之一。本文将详细介绍requests模块的功能,并通过一个综合示例展示其应用。

一、requests模块简介

requests模块是一个用于发送HTTP请求的第三方库,其设计初衷是简化HTTP请求的发送和处理。与Python标准库中的urllib相比,requests提供了更直观和便捷的API,使开发者能够快速编写功能强大的HTTP客户端。

1.1 安装requests模块

在使用requests模块之前,需要先安装它。可以使用pip进行安装:

pip install requests

1.2 导入requests模块

安装完成后,可以在Python脚本中导入requests模块:

import requests

二、发送HTTP请求

requests模块支持多种类型的HTTP请求,包括GET、POST、PUT、DELETE等。下面将逐一介绍这些请求的用法。

2.1 GET请求

GET请求用于从服务器获取数据。requests.get方法可以发送一个GET请求,并返回一个响应对象。


示例:

import requests
response = requests.get('https://api.github.com')
print(response.status_code)
print(response.text)

在这个示例中,我们向GitHub API发送了一个GET请求,并打印了响应的状态码和响应内容。

2.2 POST请求

POST请求用于向服务器提交数据。requests.post方法可以发送一个POST请求,并返回一个响应对象。


示例:

import requests
data = {'key': 'value'}
response = requests.post('https://httpbin.org/post', data=data)
print(response.status_code)
print(response.json())

在这个示例中,我们向httpbin.org发送了一个POST请求,并提交了一个包含键值对的数据。

2.3 PUT请求

PUT请求用于更新服务器上的资源。requests.put方法可以发送一个PUT请求,并返回一个响应对象。


示例:

import requests
data = {'key': 'new_value'}
response = requests.put('https://httpbin.org/put', data=data)
print(response.status_code)
print(response.json())

在这个示例中,我们向httpbin.org发送了一个PUT请求,并提交了一个包含更新数据的请求体。

2.4 DELETE请求

DELETE请求用于删除服务器上的资源。requests.delete方法可以发送一个DELETE请求,并返回一个响应对象。


示例:

import requests
response = requests.delete('https://httpbin.org/delete')
print(response.status_code)
print(response.json())

在这个示例中,我们向httpbin.org发送了一个DELETE请求,并打印了响应的状态码和响应内容。

三、请求参数和头信息

在实际应用中,通常需要在请求中包含参数和头信息。requests模块提供了便捷的方式来添加这些信息。

3.1 URL参数

可以使用params参数向URL中添加查询参数。


示例:

import requests
params = {'q': 'python'}
response = requests.get('https://www.google.com/search', params=params)
print(response.url)

在这个示例中,我们向Google搜索添加了查询参数q=python。

3.2 请求头

可以使用headers参数添加自定义请求头。


示例:

import requests
headers = {'User-Agent': 'my-app'}
response = requests.get('https://api.github.com', headers=headers)
print(response.status_code)
print(response.headers)

在这个示例中,我们向GitHub API添加了自定义的User-Agent请求头。

四、响应处理

requests模块返回的响应对象包含丰富的信息和方法,方便我们处理HTTP响应。

4.1 状态码

可以通过响应对象的status_code属性获取HTTP状态码。


示例:

import requests
response = requests.get('https://api.github.com')
print(response.status_code)

4.2 响应内容

可以通过响应对象的text和json方法获取响应内容。


示例:

import requests
response = requests.get('https://api.github.com')
print(response.text)   # 以字符串形式获取响应内容
print(response.json()) # 以JSON形式获取响应内容

4.3 响应头

可以通过响应对象的headers属性获取响应头信息。


示例:

import requests
response = requests.get('https://api.github.com')
print(response.headers)

五、文件上传和下载

在实际应用中,常常需要上传和下载文件。requests模块提供了便捷的文件处理方法。

5.1 文件上传

可以使用files参数上传文件。


示例:

import requests
files = {'file': open('test.txt', 'rb')}
response = requests.post('https://httpbin.org/post', files=files)
print(response.status_code)
print(response.json())

5.2 文件下载

可以使用响应对象的content属性保存下载的文件。


示例:

import requests
response = requests.get('https://www.example.com/image.jpg')
with open('image.jpg', 'wb') as file:
    file.write(response.content)

六、处理Cookies

requests模块可以自动处理Cookies,并允许手动设置和获取Cookies。

6.1 自动处理Cookies

示例:

import requests
session = requests.Session()
session.get('https://httpbin.org/cookies/set?name=value')
response = session.get('https://httpbin.org/cookies')
print(response.json())

6.2 手动设置和获取Cookies

示例:

import requests
cookies = {'name': 'value'}
response = requests.get('https://httpbin.org/cookies', cookies=cookies)
print(response.json())

七、超时和重试

为了防止请求长时间等待,可以设置超时时间。此外,可以通过第三方库实现请求重试机制。

7.1 设置超时时间

示例:

import requests
try:
    response = requests.get('https://www.example.com', timeout=5)
    print(response.status_code)
except requests.exceptions.Timeout:
    print('Request timed out')

7.2 实现请求重试

可以使用requests与urllib3库结合实现请求重试。


示例:

import requests
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util.retry import Retry
session = requests.Session()
retry = Retry(total=3, backoff_factor=0.1)
adapter = HTTPAdapter(max_retries=retry)
session.mount('http://', adapter)
session.mount('https://', adapter)
try:
    response = session.get('https://www.example.com')
    print(response.status_code)
except requests.exceptions.RequestException as e:
    print(f'Request failed: {e}')

八、综合示例

下面是一个综合示例,展示了如何使用requests模块实现一个简单的API客户端,获取GitHub用户的公开信息,并将结果保存为JSON文件。

import requests
import json
def fetch_github_user(username):
    url = f'https://api.github.com/users/{username}'
    response = requests.get(url)
    if response.status_code == 200:
        return response.json()
    else:
        response.raise_for_status()
def save_to_file(data, filename):
    with open(filename, 'w') as file:
        json.dump(data, file, indent=4)
def main():
    username = 'octocat'
    user_data = fetch_github_user(username)
    print(f'Fetched data for {username}:')
    print(json.dumps(user_data, indent=4))
    
    filename = f'{username}.json'
    save_to_file(user_data, filename)
    print(f'Data saved to {filename}')
if __name__ == '__main__':
    main()

运行结果:

Fetched data for octocat:
{
    "login": "octocat",
    "id": 583231,
    "node_id": "MDQ6VXNlcjU4MzIzMQ==",
    ...
}
Data saved to octocat.json

结论

本文详细介绍了Python的requests模块,包括发送各种类型的HTTP请求、处理请求参数和头信息、处理响应、文件上传和下载、处理Cookies、设置超时和实现请求重试等内容。通过综合示例,展示了如何使用requests模块实现一个简单的API客户端。希望本文能够帮助读者更好地理解和掌握requests模块,为实际项目开发提供有力支持。


作者:Rjdeng

链接:https://juejin.cn/post/7398479291263500324

相关文章
|
3天前
|
消息中间件 监控 网络协议
Python中的Socket魔法:如何利用socket模块构建强大的网络通信
本文介绍了Python的`socket`模块,讲解了其基本概念、语法和使用方法。通过简单的TCP服务器和客户端示例,展示了如何创建、绑定、监听、接受连接及发送/接收数据。进一步探讨了多用户聊天室的实现,并介绍了非阻塞IO和多路复用技术以提高并发处理能力。最后,讨论了`socket`模块在现代网络编程中的应用及其与其他通信方式的关系。
|
5天前
|
Python
Python 中常用的内置模块之`re`模块
【10月更文挑战第11天】 `re` 模块是 Python 内置的正则表达式处理工具,支持模式匹配、搜索、替换等功能。通过 `search`、`match`、`findall` 和 `sub` 等函数,结合正则表达式的元字符、分组、贪婪模式等特性,可高效完成文本处理任务。示例代码展示了基本用法,帮助快速上手。
9 1
|
5天前
|
JSON 数据格式 Python
Python基础-常用内置模块
【10月更文挑战第11天】 Python 内置模块丰富,涵盖系统交互、时间处理、数学运算、正则表达式、数据序列化等功能,如 `sys`、`os`、`time`、`datetime`、`random`、`math`、`re`、`json`、`pickle` 和 `csv` 等,极大提升了开发效率和代码质量。
8 1
|
7天前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
22 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
10天前
|
Python
Python实用记录(四):os模块-去后缀或者改后缀/指定目录下图片或者子目录图片写入txt/csv
本文介绍了如何使用Python的os模块来操作文件,包括更改文件后缀、分割文件路径和后缀、将指定目录下的所有图片写入txt文档,以及将指定目录下所有子目录中的图片写入csv文档,并为每个子目录分配一个标签。
10 1
|
7天前
|
机器学习/深度学习 缓存 Linux
python环境学习:pip介绍,pip 和 conda的区别和联系。哪个更好使用?pip创建虚拟环境并解释venv模块,pip的常用命令,conda的常用命令。
本文介绍了Python的包管理工具pip和环境管理器conda的区别与联系。pip主要用于安装和管理Python包,而conda不仅管理Python包,还能管理其他语言的包,并提供强大的环境管理功能。文章还讨论了pip创建虚拟环境的方法,以及pip和conda的常用命令。作者推荐使用conda安装科学计算和数据分析包,而pip则用于安装无法通过conda获取的包。
23 0
|
8天前
|
运维 安全 网络协议
Python 网络编程:端口检测与IP解析
本文介绍了使用Python进行网络编程的两个重要技能:检查端口状态和根据IP地址解析主机名。通过`socket`库实现端口扫描和主机名解析的功能,并提供了详细的示例代码。文章最后还展示了如何整合这两部分代码,实现一个简单的命令行端口扫描器,适用于网络故障排查和安全审计。
13 0
|
10天前
|
Python
Python中tqdm模块的常用方法和示例
`tqdm` 是一个快速、可扩展的Python进度条库,适用于长循环中添加进度提示。通过封装迭代器 `tqdm(iterator)`,可以轻松实现进度显示。支持自定义描述、宽度及嵌套进度条,适用于多种迭代对象。在Jupyter notebook中,可自动调整显示效果。
19 0
|
11天前
|
安全 网络安全 数据安全/隐私保护
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
【10月更文挑战第6天】在数字化时代,网络安全和信息安全已成为我们生活中不可或缺的一部分。本文将探讨网络安全漏洞、加密技术和安全意识等方面的内容,以帮助读者更好地了解这些主题,并采取适当的措施保护自己的信息安全。我们将通过代码示例来演示一些常见的安全漏洞,并提供解决方案。最后,我们将强调培养良好的安全意识对于维护个人和组织的信息安全的重要性。
|
8天前
|
安全 网络安全 数据安全/隐私保护
网络安全与信息安全:守护数字世界的坚盾
在数字化浪潮中,网络安全已成为维系现代社会正常运转的关键。本文旨在探讨网络安全漏洞的成因、加密技术的应用及安全意识的提升,以期为广大用户和技术人员提供实用的知识分享。通过对这些方面的深入剖析,我们期望能够共同构建一个更加安全可靠的数字环境。

热门文章

最新文章