备案控制台

开发者社区大数据文章正文

3.爬虫异常处理——状态码

2018-02-08 1708

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： #python爬虫的异常处理#爬虫遇到异常时就会直接崩溃停止运行，下次再运行时，又会从头开始。#开发一个具有顽强生命力的爬虫，必须要进行异常处理。

#python爬虫的异常处理
#爬虫遇到异常时就会直接崩溃停止运行，下次再运行时，又会从头开始。
#开发一个具有顽强生命力的爬虫，必须要进行异常处理。

#常见状态码以及含义
#301 Moved Permanently：重定向到新的URL，永久性
#302 Found：重定向到临时的URL，非永久性
#304 Not Modified：请求的资源未更新
#400 Bad Request：非法请求
#401 Unauthorized：请求未经授权
#403 Forbidden：禁止访问
#404 Not Found：没有找到对应页面
#500 Internal Server Error：服务器内部出现错误
#501 Not Implemented：服务器不支持实现请求所需要的功能

#异常处理的两个类URLError和HTTPError
#HTTPError是URLError的子类，HTTPError有异常状态码及异常原因，而URLError没有异常状态码
##URLError发生的原因主要有：1.连不上服务器。2.访问的URL不存在。3.没有网络。4.触发了HRRPError子类

import urllib.error
import urllib.request
try:
    urllib.request.urlopen("http://blog.csdn.net")
except urllib.error.URLError as e:
    if hasattr(e,"code"):
        print(e.code)
    if hasattr((e,"reason")):
        print(e.reason)

文章标签：

数据采集

Python

关键词：

爬虫异常处理

wsc449

目录

相关文章

天降攻城狮

7、web爬虫讲解2—urllib库爬虫—状态吗—异常处理—浏览器伪装技术、设置用户代理

如果爬虫没有异常处理，那么爬行中一旦出现错误，程序将崩溃停止工作，有异常处理即使出现错误也能继续执行下去 1.

天降攻城狮

1407 0 0

techlee

|

数据采集 Python

Python爬虫day3.2—python异常处理

异常处理概述 python程序在执行的时候，经常会遇到异常，如果中间异常不处理，经常会导致程序崩溃。比如爬虫，如果不进行异常处理，很可能虫爬了一半，直接崩溃了。

techlee

827 0 0

土木林森

|

2月前

|

数据采集存储 JSON

Python网络爬虫：Scrapy框架的实战应用与技巧分享

【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理，以及存储爬取的数据。通过具体示例，帮助读者掌握Scrapy的核心功能和使用方法，提升数据采集效率。

土木林森

117 6 6

python编程狮

|

5月前

|

机器学习/深度学习数据采集数据可视化

基于爬虫和机器学习的招聘数据分析与可视化系统，python django框架，前端bootstrap，机器学习有八种带有可视化大屏和后台

本文介绍了一个基于Python Django框架和Bootstrap前端技术，集成了机器学习算法和数据可视化的招聘数据分析与可视化系统，该系统通过爬虫技术获取职位信息，并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析，提供了一个直观的可视化大屏和后台管理系统，以优化招聘策略并提升决策质量。

python编程狮

252 4 5

请看我回答~

|

5月前

|

数据采集存储搜索推荐

打造个性化网页爬虫：从零开始的Python教程

【8月更文挑战第31天】在数字信息的海洋中，网页爬虫是一艘能够自动搜集网络数据的神奇船只。本文将引导你启航，用Python语言建造属于你自己的网页爬虫。我们将一起探索如何从无到有，一步步构建一个能够抓取、解析并存储网页数据的基础爬虫。文章不仅分享代码，更带你理解背后的逻辑，让你能在遇到问题时自行找到解决方案。无论你是编程新手还是有一定基础的开发者，这篇文章都会为你打开一扇通往数据世界的新窗。

请看我回答~

62 0 0

东方睿赢

|

6月前

|

数据采集存储 JSON

从零到一构建网络爬虫帝国：HTTP协议+Python requests库深度解析

【7月更文挑战第31天】在网络数据的海洋中，使用Python的`requests`库构建网络爬虫就像探索未知的航船。HTTP协议指导爬虫与服务器交流，收集信息。HTTP请求包括请求行、头和体，响应则含状态行、头和体。`requests`简化了发送各种HTTP请求的过程。

东方睿赢

101 4 4

beloved000

|

3月前

|

数据采集存储数据挖掘

深入探索 Python 爬虫：高级技术与实战应用

本文介绍了Python爬虫的高级技术，涵盖并发处理、反爬虫策略（如验证码识别与模拟登录）及数据存储与处理方法。通过asyncio库实现异步爬虫，提升效率；利用tesseract和requests库应对反爬措施；借助SQLAlchemy和pandas进行数据存储与分析。实战部分展示了如何爬取电商网站的商品信息及新闻网站的文章内容。提醒读者在实际应用中需遵守法律法规。

beloved000

218 66 66

小白学大数据

|

2月前

|

数据采集 Web App开发 JavaScript

爬虫策略规避：Python爬虫的浏览器自动化

爬虫策略规避：Python爬虫的浏览器自动化

小白学大数据

137 1 1

土木林森

|

2月前

|

数据采集前端开发中间件

Python网络爬虫：Scrapy框架的实战应用与技巧分享

【10月更文挑战第26天】Python是一种强大的编程语言，在数据抓取和网络爬虫领域应用广泛。Scrapy作为高效灵活的爬虫框架，为开发者提供了强大的工具集。本文通过实战案例，详细解析Scrapy框架的应用与技巧，并附上示例代码。文章介绍了Scrapy的基本概念、创建项目、编写简单爬虫、高级特性和技巧等内容。

土木林森

99 4 4

bruce_xiaowei

|

3月前

|

数据采集 JavaScript 前端开发

JavaScript逆向爬虫——使用Python模拟执行JavaScript

JavaScript逆向爬虫——使用Python模拟执行JavaScript

bruce_xiaowei

55 2 2

热门文章

最新文章

Java爬虫：数据采集的强大工具

Java爬虫：深入解析商品详情的利器

构建高效的Python网络爬虫：从入门到实践

Python 爬虫必备杀器，xpath 解析 HTML

Python爬虫：深入探索1688关键词接口获取之道

利用Python爬虫获取1688关键词接口全攻略

网页爬虫技术全解析：从基础到实战

如何利用Python爬虫淘宝商品详情高级版（item_get_pro）API接口及返回值解析说明

Python爬虫京东商品详情数据接口

Python爬虫能处理动态加载的内容吗？

Lua vs. Python：哪个更适合构建稳定可靠的长期运行爬虫？

揭秘豆瓣网站爬虫：利用lua-resty-request库获取图片链接

网络爬虫实战演练

Python 爬虫：Spring Boot 反爬虫的成功案例

使用Python实现简单的Web爬虫

Node.js爬虫在租房信息监测与分析中的应用

如何利用Python构建高效的Web爬虫

Python爬虫技术与数据可视化：Numpy、pandas、Matplotlib的黄金组合

静态代理IP对反爬虫策略的应对，以及静态ip对爬虫的助力

Python爬虫：数据获取与解析的艺术

相关课程

更多

Python爬虫实战

Python网络爬虫实战

相关电子书

更多

Python第五讲——关于爬虫如何做js逆向的思路

低代码开发师（初级）实战教程

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云无影云电脑免费试用，最长可试用3个月