一日一技:大幅度提高requests的访问速度

简介: 一日一技:大幅度提高requests的访问速度

摄影:产品经理与产品经理环游世界

我做了一个垃圾信息过滤的 HTTP 接口。现在有一千万条消息需要经过这个接口进行垃圾检测。

一开始我的代码是这样的:

import requests
messages = ['第一条', '第二条', '第三条']
for message in messages:
    resp = requests.post(url, json={'msg': message}).json()
    if resp['trash']:
        print('是垃圾消息')

我们写一段代码来看看运行速度:

访问一百次百度,竟然需要 20 秒。那我有一千万条信息,这个时间太长了。

有没有什么加速的办法呢?除了我们之前文章讲到的 多线程、aiohttp 或者干脆用 Scrapy 外,还可以让 requests 保持连接从而减少频繁进行 TCP 三次握手的时间消耗。

那么要如何让 requests 保持连接呢?实际上非常简单,使用Session对象即可。

修改后的代码:

import requests
import time
start = time.time()
session = requests.Session()
for _ in range(100):
    resp = session.get('https://baidu.com').content.decode()
end = time.time()
print(f'访问一百次网页,耗时:{end - start}')

运行效果如下图所示:

性能得到了显著提升。访问 100 页只需要 5 秒钟。

官方文档[1]中,requests 也说到了 Session对象能够保持连接:

The Session object allows you to persist certain parameters across requests. It also persists cookies across all requests made from the Session instance, and will use urllib3’s connection pooling. So if you’re making several requests to the same host, the underlying TCP connection will be reused, which can result in a significant performance increase (see HTTP persistent connection).

Excellent news — thanks to urllib3, keep-alive is 100% automatic within a session! Any requests that you make within a session will automatically reuse the appropriate connection!

目录
相关文章
|
8月前
|
数据采集
requests爬虫
requests爬虫
54 1
|
20天前
|
负载均衡 监控 定位技术
HTTP代理网速变慢的原因及优化策略
随着互联网技术的发展,使用HTTP动态代理IP的人越来越多。本文介绍了HTTP代理网速变慢的六个常见原因及解决方法,包括代理服务器的地理位置、带宽、服务器负载、网络拥塞、配置问题和数据加密解密时间。通过识别和解决这些问题,可以有效提升HTTP代理的网速。
53 10
|
2月前
|
缓存 前端开发 JavaScript
加快网站访问速度
【10月更文挑战第26天】在当今在线时代,网站是企业发展的关键。然而,页面加载延迟会导致客户流失,影响SEO排名和投资回报率。为提升网站速度,建议:1) 升级托管计划;2) 使用CDN;3) 减少HTTP请求;4) 图像优化;5) 启用缓存;6) CSS和JS优化;7) 避免过多插件;8) 快速DNS查找;9) 其他优化措施如更换轻量级主题、启用Gzip压缩及修复损坏链接。
58 5
|
4月前
请求模块requests;代理服务
请求模块requests(五)
62 15
|
4月前
|
数据采集 Web App开发 开发工具
|
5月前
|
缓存 开发工具
使用varnish缓存多个网站(三)
【8月更文挑战第9天】使用varnish缓存多个网站
73 5
|
5月前
|
存储 缓存 Linux
使用Varnish为网站加速(二)缓存一个网站
【8月更文挑战第9天】使用Varnish为网站加速安装使用缓存一个网站
35 1
|
7月前
|
Java 应用服务中间件 Maven
提升浏览器访问速度的技巧
提升浏览器访问速度的技巧
|
Web App开发 存储 缓存
浏览器缓存机制介绍与缓存策略剖析
浏览器缓存机制介绍与缓存策略剖析
241 0
|
Web App开发 XML 缓存
使用ehcache缓存页面、ExpiresFilter添加Expires头,大幅提升网站性能
使用ehcache缓存页面、ExpiresFilter添加Expires头,大幅提升网站性能
231 0
使用ehcache缓存页面、ExpiresFilter添加Expires头,大幅提升网站性能

热门文章

最新文章