文档备案控制台

开发者社区大数据文章正文

python网络爬虫 - 设定重试次数内反复抓取

2016-05-24 1348

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： import urllib.request def download(url, num_retries=2): print('Downloading:', url) try: html = urllib.

import urllib.request

def download(url, num_retries=2):
    print('Downloading:', url)
    try:
        html = urllib.request.urlopen(url).read()
    except urllib.URLError as e:
        print('Download error:' % e.reason)
        html = None
        if num_retries > 0:
            if hasattr(e, 'code') and 500 <= e.code < 600:
                # recursively retry 5xx HTTP errors
                return download(url, num_retries-1)
    return html
    
url = 'http://www.google.com'
print(download(url, 3))

文章标签：

Python

数据采集

关键词：

Python网络

网络设定

Python爬虫

Python抓取

Python爬虫抓取

master_haku

目录

相关文章

荔枝科研社

|

7月前

|

机器学习/深度学习算法安全

【PSO-LSTM】基于PSO优化LSTM网络的电力负荷预测（Python代码实现）

【PSO-LSTM】基于PSO优化LSTM网络的电力负荷预测（Python代码实现）

荔枝科研社

345 0 0

蓝易云

|

5月前

|

网络协议 Linux 虚拟化

配置VM网络：如何设定静态IP以访问主机IP和互联网

以上就是设定虚拟机网络和静态IP地址的基本步骤。需要注意的是，这些步骤可能会因为虚拟机软件、操作系统以及网络环境的不同而有所差异。在进行设定时，应根据具体情况进行调整。

蓝易云

433 10 10

计算机程序设计的泡泡Y2013070224

|

5月前

|

机器学习/深度学习大数据关系型数据库

基于python大数据的青少年网络使用情况分析及预测系统

本研究基于Python大数据技术，构建青少年网络行为分析系统，旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据，运用机器学习实现精准行为预测与实时干预，推动数字治理向“数据驱动”转型，为家庭、学校及政府提供科学决策支持，助力青少年健康上网。

计算机程序设计的泡泡Y2013070224

474 2 2

荔枝科研社

|

6月前

|

机器学习/深度学习算法 PyTorch

【Pytorch框架搭建神经网络】基于DQN算法、优先级采样的DQN算法、DQN + 人工势场的避障控制研究（Python代码实现）

【Pytorch框架搭建神经网络】基于DQN算法、优先级采样的DQN算法、DQN + 人工势场的避障控制研究（Python代码实现）

荔枝科研社

161 1 1

小白学大数据

|

7月前

|

数据采集存储 JSON

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

地区电影市场分析：用Python爬虫抓取猫眼/灯塔专业版各地区票房

小白学大数据

627 2 2

小白学大数据

|

10月前

|

数据采集 Web App开发 JavaScript

基于Selenium的Python爬虫抓取动态App图片

基于Selenium的Python爬虫抓取动态App图片

小白学大数据

722 68 69

荔枝科研社

|

6月前

|

机器学习/深度学习算法 PyTorch

【DQN实现避障控制】使用Pytorch框架搭建神经网络，基于DQN算法、优先级采样的DQN算法、DQN + 人工势场实现避障控制研究（Matlab、Python实现）

【DQN实现避障控制】使用Pytorch框架搭建神经网络，基于DQN算法、优先级采样的DQN算法、DQN + 人工势场实现避障控制研究（Matlab、Python实现）

荔枝科研社

253 0 0

荔枝科研社

|

7月前

|

机器学习/深度学习算法调度

基于遗传算法GA算法优化BP神经网络（Python代码实现）

基于遗传算法GA算法优化BP神经网络（Python代码实现）

荔枝科研社

458 0 0

荔枝科研社

|

7月前

|

机器学习/深度学习数据采集 TensorFlow

基于CNN-GRU-Attention混合神经网络的负荷预测方法（Python代码实现）

基于CNN-GRU-Attention混合神经网络的负荷预测方法（Python代码实现）

荔枝科研社

371 0 0

小白学大数据

|

7月前

|

数据采集存储 XML

Python爬虫XPath实战：电商商品ID的精准抓取策略

Python爬虫XPath实战：电商商品ID的精准抓取策略

小白学大数据

637 0 0

热门文章

最新文章

PyODPS 中使用 Python UDF

【Python】已解决：ModuleNotFoundError: No module named ‘sklearn‘

Python+Appium自动化测试(5)-appium元素定位常用方法（二）

Python编程：twine模块打包python项目上传pypi

python学习第七篇 sql优化

python中引号中有双引号

确保你已经安装了`python-barcode`库。如果没有，可以通过pip来安装：

Python牛刀小试(五)--logging模块

Python数据分析之dataframe索引会这个就行啦

Django python 注册

Prompt 工程实战：如何让 AI 生成高质量的 aiohttp 异步爬虫代码

实战：Python爬虫如何模拟登录与维持会话状态

解析Python爬虫中的Cookies和Session管理

反爬虫机制深度解析：从基础防御到高级对抗的完整技术实战

爬虫与自动化技术深度解析：从数据采集到智能运维的完整实战指南

Python异步编程实战：爬虫案例

Python爬虫技术：从基础到实战的完整教程

新闻热点一目了然：Python爬虫数据可视化

单机扛不住，我把爬虫搬上了 Kubernetes：弹性伸缩与成本优化的实战

Selenium爬虫部署七大常见错误及修复方案：从踩坑到避坑的实战指南

相关课程

更多

Python Web开发基础

Python爬虫实战

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

ECS账号安全防护最佳实践