开发者社区> 韦玮> 正文

精通Python网络爬虫-书籍介绍

简介:  内容简介 本书从技术、工具与实战3个维度讲解了Python网络爬虫: 技术维度:详细讲解了Python网络爬虫实现的核心技术,包括网络爬虫的工作原理、如何用urllib...
+关注继续查看

内容简介

本书从技术、工具与实战3个维度讲解了Python网络爬虫:

技术维度:详细讲解了Python网络爬虫实现的核心技术,包括网络爬虫的工作原理、如何用urllib库编写网络爬虫、爬虫的异常处理、正则表达式、爬虫中Cookie的使用、爬虫的浏览器伪装技术、定向爬取技术、反爬虫技术,以及如何自己动手编写网络爬虫;

工具维度:以流行的Python网络爬虫框架Scrapy为对象,详细讲解了Scrapy的功能使用、高级技巧、架构设计、实现原理,以及如何通过Scrapy来更便捷、高效地编写网络爬虫;

实战维度:以实战为导向,是本书的主旨,除了完全通过手动编程实现网络爬虫和通过Scrapy框架实现网络爬虫的实战案例以外,本书还有博客爬取、图片爬取、模拟登录等多个综合性的网络爬虫实践案例。

作者在Python领域有非常深厚的积累,不仅精通Python网络爬虫,在Python机器学习、Python数据分析与挖掘、Python Web开发等多个领域都有丰富的实战经验

作者简介

韦玮

资深网络爬虫技术专家、大数据专家和软件开发工程师,从事大型软件开发与技术服务多年,现任重庆韬翔网络科技有限公司创始人兼CEO,国家专利发明人。

精通Python技术,在Python网络爬虫、Python机器学习、Python数据分析与挖掘、Python Web开发等多个领域都有丰富的实战经验。

CSDN、51CTO、天善智能等科技类社区和媒体的特邀专家和讲师,输出了大量的高质量课程和文章,深受用户喜爱。

微博:http://weibo.com/qiansyy

媒体评论
网络爬虫是互联网上进行信息采集的通用手段,在互联网的各个专业方向上都是不可或缺的底层技术支撑。本书从爬虫基础开始,全面阐述了Python网络爬虫技术,并且包含各种经典的网络爬虫项目案例,特别是详细给出了基于Scapy框架实现网络爬虫的*实践方案与流程,实战性非常强,是一本关于Python网络爬虫的优秀实战书籍,值得推荐。 
——诸葛建伟 清华大学副研究员/《Metasploit渗透测试魔鬼训练营》作者

本书详细讲解了如何基于Python从零开始构建一个成熟的网络爬虫解决方案的完整过程,以及业界主流爬虫技术的原理与实战案例,同时也引入了作者个人的经验与思考,非常有价值。本书循序渐进的内容组织结构,相信无论是新手还是老手,均能很好地阅读和吸收。
——刘天斯 腾讯高级工程师,《Python自动化运维》作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
python模块介绍- SocketServer 网络服务框架
来源:https://my.oschina.net/u/1433482/blog/190612 摘要: SocketServer简化了网络服务器的编写。它有4个类:TCPServer,UDPServer,UnixStreamServer,UnixDatagramServer。
942 0
IPerf——网络测试工具介绍与源码解析(2)
对于IPerf源码解析,我是基于2.0.5版本在Windows下执行的情况进行分析的,提倡开始先通过对源码的简单修改使其能够在本地编译器运行起来,这样可以打印输出一些中间信息,对于理解源码的逻辑,程序实现的过程能够起到事半功倍的效果。
1005 0
Python中字典的简单介绍
目前正在学习Python基础语法,此篇文章将简单介绍Python中字典的相关用法
44 0
python网络编程
http://hi.baidu.com/showimg/blog/item/40586838c1c59e2b97ddd897.
564 0
Python中的字符串介绍(下)
在上一篇文章中,我们学会了在python中,通过%以及format函数的方式去进行字符串的格式化,今天,我们来继续学习一种新的方式:f-string。是Python3.6新引入的一种字符串格式化方法,据说性能比前面两种方法更优,代码看上去也更简洁。
25 0
关于网络摄像机的带宽占用知识介绍
今时代,远程监控需求的提升,带来网络摄像机、网络视频服务器市场的迅猛发展,而网络摄像机与传统摄像机运行环境的重要区别,就是信号传输介质不同,传统摄像机通过视频线、双绞线或光纤传输,一般是每路视频信号“独享”一条线路,几乎没有带宽的约束,而网络摄像机和网络视频服务器则是通过网络传输,普通的Inertnet线路,带宽只有几百K至几M(普通ADSL线路上行为512K,下行为2M),而运用中往往需要一条线路同时传多路音视频信号,带宽的约束马上显现出来。
915 0
如何给Python轻应用添加新的组件:Python轻应用扩展适配介绍
如何给Python轻应用添加新的组件:Python轻应用扩展适配介绍
96 0
IPerf——网络测试工具介绍与源码解析(3)
【线程的生成】   生成线程时需要传入一个thread_Settings类型的变量,thread_Settings包含所有线程运行时需要的信息,命令行选项参数解析后所有得到的属性都存储到该类型的变量中,作为线程生成的传入值能够决定当前线程扮演的角色。
764 0
+关注
韦玮
韦玮,企业家,资深IT技术专家/讲师/作家,畅销书《精通Python网络爬虫》作者。
9
文章
31
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载