文档备案控制台

开发者社区大数据文章正文

python爬虫翻页_python爬虫怎么实现翻页

2022-07-18 987

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： python爬虫翻页_python爬虫怎么实现翻页

python爬虫翻页_python爬虫怎么实现翻页

很多初学python爬虫的小伙伴们都会遇到python爬虫翻页的问题，我在这里先介绍一种。

需要爬取的网站如图所示

1561710060206344.jpg

查询的这种植物有四页。当我们平时翻页时，首先想到肯定是点击页面上的下一页，写爬虫也是如此，想提取页面上的链接进行访问。但是这样做很麻烦，并且效率很低。

翻页的方式一般有两种：

1、观察网站翻页时链接变化

2、如果写爬虫的请求方式是post方式请求，则需要观察post的数据的变化是否有规律

今天讲得是第一种方法

如图，当我点击下一页时，观察到地址栏的链接变化

1561710131260426.jpg

在链接中我们可以惊喜的发现，有page关键字，而且恰好为2，我们试验一下，将链接中page的值改为3，发现正常访问，正好是第三页。因此，我们找到了翻页方式，更改链接中关键字的值。

因此翻页过程步骤为：

1、获取总网页数目

2、利用for循环改变page的值，进行翻页。

具体翻页代码实现如下：

获取总页码

1561710206437452.jpg

网络请求方式

1561710344397875.jpg

改变请求头中的page数值

1561710415815436.jpg

文章标签：

Python

数据采集

关键词：

Python爬虫

爬虫python

爬虫翻页

Python翻页

政胤

目录

相关文章

小白学大数据

|

7月前

|

数据采集 Web App开发数据安全/隐私保护

实战：Python爬虫如何模拟登录与维持会话状态

实战：Python爬虫如何模拟登录与维持会话状态

小白学大数据

1117 1 2

小白学大数据

|

8月前

|

数据采集 Web App开发自然语言处理

新闻热点一目了然：Python爬虫数据可视化

新闻热点一目了然：Python爬虫数据可视化

小白学大数据

780 6 6

站大爷

|

9月前

|

数据采集数据挖掘测试技术

Go与Python爬虫实战对比：从开发效率到性能瓶颈的深度解析

本文对比了Python与Go在爬虫开发中的特点。Python凭借Scrapy等框架在开发效率和易用性上占优，适合快速开发与中小型项目；而Go凭借高并发和高性能优势，适用于大规模、长期运行的爬虫服务。文章通过代码示例和性能测试，分析了两者在并发能力、错误处理、部署维护等方面的差异，并探讨了未来融合发展的趋势。

站大爷

967 0 0

蒋星熠Jaxonic

|

7月前

|

数据采集监控数据库

Python异步编程实战：爬虫案例

🌟 蒋星熠Jaxonic，代码为舟的星际旅人。从回调地狱到async/await协程天堂，亲历Python异步编程演进。分享高性能爬虫、数据库异步操作、限流监控等实战经验，助你驾驭并发，在二进制星河中谱写极客诗篇。

蒋星熠Jaxonic

646 3 3

Python异步编程实战：爬虫案例

蓝易云

|

8月前

|

数据采集存储 XML

Python爬虫技术：从基础到实战的完整教程

最后强调: 父母法律法规限制下进行网络抓取活动; 不得侵犯他人版权隐私利益; 同时也要注意个人安全防止泄露敏感信息.

蓝易云

1038 19 19

小白学大数据

|

7月前

|

数据采集存储 JSON

Python爬虫常见陷阱：Ajax动态生成内容的URL去重与数据拼接

Python爬虫常见陷阱：Ajax动态生成内容的URL去重与数据拼接

小白学大数据

221 1 1

小白学大数据

|

8月前

|

数据采集存储 Web App开发

处理Cookie和Session：让Python爬虫保持连贯的"身份"

处理Cookie和Session：让Python爬虫保持连贯的"身份"

小白学大数据

490 0 2

winx_19970108018

|

7月前

|

数据采集存储 JavaScript

解析Python爬虫中的Cookies和Session管理

Cookies与Session是Python爬虫中实现状态保持的核心。Cookies由服务器发送、客户端存储，用于标识用户；Session则通过唯一ID在服务端记录会话信息。二者协同实现登录模拟与数据持久化。

winx_19970108018

434 0 0

小白学大数据

|

9月前

|

数据采集存储 JSON

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

小白学大数据

873 2 2

小白学大数据

|

8月前

|

数据采集 Web App开发前端开发

处理动态Token：Python爬虫应对AJAX授权请求的策略

处理动态Token：Python爬虫应对AJAX授权请求的策略

小白学大数据

666 0 0

热门文章

最新文章

Python爬虫知识点梳理

Python网络爬虫反爬破解策略实战

Scrapy分布式、去重增量爬虫的开发与设计

[python爬虫] Selenium爬取新浪微博内容及用户信息

利用Python和Selenium实现定时任务爬虫

知乎高颜值图片抓取到本地(Python3 爬虫.人脸检测.颜值检测)

Dynamic Website 爬虫：应对动态内容与 JavaScript 渲染挑战

python爬虫思路

Python写的Web spider（网络爬虫）

基于python大数据的台风灾害分析及预测系统

基于Python大数据的热门游戏推荐系统

基于python大数据的青少年网络使用情况分析及预测系统

2026版基于python大数据的电影分析可视化系统

基于Python大数据的的电商用户行为分析系统

基于python大数据技术的医疗数据分析与研究

基于python大数据深度学习的酒店评论文本情感分析系统

Python SQLAlchemy模块：从入门到实战的数据库操作指南

基于python大数据的的海洋气象数据可视化平台

基于Python大数据的主流汽车价格分析可视化系统

相关课程

更多

Python Web开发基础

Python爬虫实战

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

阿里云正式发布 Agentic 代码安全：AI驱动的双Agent协同引擎