如何解决URLerror中的异常?原来这样也行

简介: 前言我们每次编写爬虫程序的时候,总会遇到一些异常,相信大家都很头疼的去百度,却没什么效果,本节为你们介绍两个普通的异常,,,,,URLError还有HTTPError,以及对它们的一些处理。1.URLError首先解释下URLError可能产生的原因:· 网络无连接,即本机无法上网· 连接不到特定的服务器· 服务器不存在在代码中,我们需要用try-except语句来包围并捕获相应的异常。

前言

我们每次编写爬虫程序的时候,总会遇到一些异常,相信大家都很头疼的去百度,却没什么效果,本节为你们介绍两个普通的异常,,,,,URLError还有HTTPError,以及对它们的一些处理。

1.URLError

首先解释下URLError可能产生的原因:

· 网络无连接,即本机无法上网

· 连接不到特定的服务器

· 服务器不存在

在代码中,我们需要用try-except语句来包围并捕获相应的异常。下面是一个例子,先感受下它的风骚之气

import urllib2

requset = urllib2.Request('http://www.zhimaruanjian.com')

try:

    urllib2.urlopen(requset)

except urllib2.URLError, e:

    print e.reason

我们利用了 urlopen方法访问了一个不存在的网址,运行结果如下:


[Errno 11004] getaddrinfo failed```

它说明了错误代号是11004,错误原因是 getaddrinfo failed

![](https://yqfile.alicdn.com/4d3bd45ea6b9250ff772754973e5a783c4589f6a.png)
>**
小编推荐一个学python的学习qun 740322234
无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!**


**2.HTTPError**

HTTPError是URLError的子类,在你利用urlopen方法发出一个请求时,服务器上都会对应一个应答对象response,其中它包含一个数字”状态码”。举个例子,假如response是一个”重定向”,需定位到别的地址获取文档,urllib2将对此进行处理。

其他不能处理的,urlopen会产生一个HTTPError,对应相应的状态吗,HTTP状态码表示HTTP协议所返回的响应的状态。下面将状态码归结如下:  

100:继续 客户端应当继续发送请求。客户端应当继续发送请求的剩余部分,或者如果请求已经完成,忽略这个响应。

101: 转换协议 在发送完这个响应最后的空行后,服务器将会切换到在Upgrade 消息头中定义的那些协议。只有在切换新的协议更有好处的时候才应该采取类似措施。

102:继续处理 由WebDAV(RFC 2518)扩展的状态码,代表处理将被继续执行。

200:请求成功 处理方式:获得响应的内容,进行处理

201:请求完成,结果是创建了新资源。新创建资源的URI可在响应的实体中得到 处理方式:爬虫中不会遇到

202:请求被接受,但处理尚未完成 处理方式:阻塞等待

204:服务器端已经实现了请求,但是没有返回新的信 息。如果客户是用户代理,则无须为此更新自身的文档视图。 处理方式:丢弃

300:该状态码不被HTTP/1.0的应用程序直接使用, 只是作为3XX类型回应的默认解释。存在多个可用的被请求资源。 处理方式:若程序中能够处理,则进行进一步处理,如果程序中不能处理,则丢弃
301:请求到的资源都会分配一个永久的URL,这样就可以在将来通过该URL来访问此资源 处理方式:重定向到分配的URL

302:请求到的资源在一个不同的URL处临时保存 处理方式:重定向到临时的URL

304:请求的资源未更新 处理方式:丢弃

400:非法请求 处理方式:丢弃

401:未授权 处理方式:丢弃

403:禁止 处理方式:丢弃

404:没有找到 处理方式:丢弃

500:服务器内部错误 服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。一般来说,这个问题都会在服务器端的源代码出现错误时出现。

501:服务器无法识别 服务器不支持当前请求所需要的某个功能。当服务器无法识别请求的方法,并且无法支持其对任何资源的请求。

502:错误网关 作为网关或者代理工作的服务器尝试执行请求时,从上游服务器接收到无效的响应。

503:服务出错 由于临时的服务器维护或者过载,服务器当前无法处理请求。这个状况是临时的,并且将在一段时间以后恢复。

HTTPError实例产生后会有一个code属性,这就是是服务器发送的相关错误号。
因为urllib2可以为你处理重定向,也就是3开头的代号可以被处理,并且100-299范围的号码指示成功,所以你只能看到400-599的错误号码。

下面我们写一个例子来感受一下,捕获的异常是HTTPError,它会带有一个code属性,就是错误代号,另外我们又打印了reason属性,这是它的父类URLError的属性。

import urllib2

req = urllib2.Request('http://www.zhimaruanjian.com')

try:

urllib2.urlopen(req)

except urllib2.HTTPError, e:

print e.code

print e.reason```

运行结果如下


403

Forbidden```

错误代号是403,错误原因是Forbidden,说明服务器禁止访问。

我们知道,HTTPError的父类是URLError,根据编程经验,父类的异常应当写到子类异常的后面,如果子类捕获不到,那么可以捕获父类的异常,所以上述的代码可以这么改写

import urllib2

req = urllib2.Request('http://www.zhimaruanjian.com')

try:

urllib2.urlopen(req)

except urllib2.HTTPError, e:

print e.code

except urllib2.URLError, e:

print e.reason

else:

print "OK"```

如果捕获到了HTTPError,则输出code,不会再处理URLError异常。如果发生的不是HTTPError,则会去捕获URLError异常,输出错误原因。

另外还可以加入 hasattr属性提前对属性进行判断,代码改写如下


import urllib2

 

req = urllib2.Request('http://www.zhimaruanjian.com')

try:

    urllib2.urlopen(req)

except urllib2.URLError, e:

    if hasattr(e,"code"):

        print e.code

    if hasattr(e,"reason"):

        print e.reason

else:

    print "OK"```

首先对异常的属性进行判断,以免出现属性输出报错的现象。
相关文章
|
存储 Oracle 搜索推荐
电子商务中数据库的应用以及选择
【4月更文挑战第10天】电子商务依赖数据库进行数据存储与管理,涵盖产品信息、订单、用户数据。数据库支持数据分析,揭示市场趋势,助力企业决策。在客户关系管理中,数据库帮助理解客户行为,实现个性化服务。订单处理也离不开数据库,确保操作准确高效。数据库系统如MySQL、Oracle满足不同业务需求,选择时要考虑性能、规模及管理特性。合适的数据库对电商业务的性能和稳定性至关重要。
470 4
|
机器学习/深度学习 数据采集 监控
构建高效机器学习模型的五大关键步骤
在数据科学领域,搭建一个高效的机器学习模型是实现数据驱动决策的核心。本文详细阐述了从数据预处理到模型评估五个关键步骤,旨在为读者提供一个清晰的建模流程。文中不仅介绍了各个步骤的理论依据,还结合了实用的技术细节,以期帮助读者在实际工作中构建出既健壮又精确的机器学习系统。
389 5
|
Docker 容器
如何通过pid定位是哪个容器
如何通过pid定位是哪个容器
310 0
|
10月前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
10月前
|
运维 自然语言处理 搜索推荐
2024年最新CRM软件排行榜出炉,哪一款适合你?
本文概述了2024年最新CRM软件排行榜,精选了10款市场上最受欢迎的CRM软件,从销售易、销帮帮到神州云动等,详细分析了各软件的推荐理由、品牌背景、核心功能、优势特色及适用企业类型,为企业提供全面的参考,助力企业数字化转型和业务增长。
|
12月前
|
传感器 机器学习/深度学习 自动驾驶
未来出行的智能革命:自动驾驶技术的进展与挑战
自动驾驶技术正逐步改变我们的交通方式,从辅助驾驶到完全自动化,每一次技术跃迁都带来了新的可能。本文将探讨自动驾驶的发展历程、关键技术里程碑及其面临的主要挑战和未来趋势。
694 4
|
JSON 前端开发 测试技术
Postman 接口测试工具详解
在执行这些测试案例时,请确保遵循实际的API规范,并根据API的特定要求调整步骤和参数。
355 0
|
机器学习/深度学习 数据采集 算法
Python使用随机森林模型进行电影评分预测
Python使用随机森林模型进行电影评分预测
1820 1
Python使用随机森林模型进行电影评分预测
|
JSON Rust 监控
公司电脑监控软件的Rust编程实现与安全性提升
这篇文章介绍了如何使用Rust编程语言开发一个基础的企业电脑监控软件,包括初始化项目、捕获键盘输入、监控网络活动。同时,文章强调了提升安全性的重要性,提出了数据加密(如AES)和完整性校验(如SHA-256)的方法,并展示了如何将监控数据自动提交到远程服务器。通过Rust,开发者能创建高效且安全的监控解决方案。
438 2
|
前端开发 Java C++
【面试题】calc()计算函数的作用和理解
【面试题】calc()计算函数的作用和理解
387 0
【面试题】calc()计算函数的作用和理解