手把手教你如何新建scrapy爬虫框架的第一个项目(上)

简介: 前几天给大家分享了如何在Windows下创建网络爬虫虚拟环境及如何安装Scrapy还有Scrapy安装过程中常见的问题总结及其对应的解决方法感兴趣的小伙伴可以戳链接进去查看。关于Scrapy的介绍之前也在文章中提及过今天小编带大家进入Scrapy爬虫框架创建Scrapy爬虫框架的第一个项目具体过程如下所示。

前几天给大家分享了如何在Windows下创建网络爬虫虚拟环境及如何安装Scrapy还有Scrapy安装过程中常见的问题总结及其对应的解决方法感兴趣的小伙伴可以戳链接进去查看。关于Scrapy的介绍之前也在文章中提及过今天小编带大家进入Scrapy爬虫框架创建Scrapy爬虫框架的第一个项目具体过程如下所示。


手把手教你如何新建scrapy爬虫框架的第一个项目上


1、进入虚拟环境不知道进入的环境的小伙伴可以戳这篇文章在Windows下如何创建指定的虚拟环境和在Windows下如何创建虚拟环境默认情况下。进入到环境之后可以通过“pip list”命令查看Scrapy是否安装成功如下图所示。


手把手教你如何新建scrapy爬虫框架的第一个项目上


可以看到Scrapy已经安装成功。

2、这里小编欲将Scrapy项目放到demo文件夹下所以先退回到上级目录中去如下图所示。


手把手教你如何新建scrapy爬虫框架的第一个项目上


3、尔后开始新建Scrapy项目输入创建Scrapy爬虫项目命令“scrapy startproject article”其中article是爬虫项目的名称可以自行更改的。输入创建命令之后稍等片刻系统会根据模板进行创建项目模板所在的目录是“D:pythonDemo8Septemberdemoscrapy_demoLibsite-packagesscrapy emplatesproject”与你的爬虫环境相关如下图所示等待项目创建完成。当然我们可以自定义爬虫模板不过目前来看Scrapy爬虫框架提供的模板够我们用的了我们能把Scrapy搞明白也就可以了。


手把手教你如何新建scrapy爬虫框架的第一个项目上


4、根据上图提示首先进入到article文件夹下输入命令“cd article”之后通过“dir”查看目录也可以通过“tree /f”生成文件目录的树形结构如下图所示可以很清晰的看到Scrapy创建命令生成的文件。


手把手教你如何新建scrapy爬虫框架的第一个项目上


顶层的article文件夹是项目名。

第二层中包含的是一个与项目名同名的文件夹article和一个文件scrapy.cfg这个与项目同名的文件夹article是一个模块所有的项目代码都在这个模块内添加而scrapy.cfg文件是整个Scrapy项目的配置文件。

第三层中有5个文件和一个文件夹其中__init__.py是个空文件作用是将其上级目录变成一个模块items.py是定义储对象的文件决定爬取哪些项目middlewares.py文件是中间件一般不用进行修改主要负责相关组件之间的请求与响应pipelines.py是管道文件决定爬取后的数据如何进行处理和存储settings.py是项目的设置文件设置项目管道数据的处理方法、爬虫频率、表名等spiders文件夹中放置的是爬虫主体文件用于实现爬虫逻辑和一个__init__.py空文件。

5、在Windows文件夹下也可以很清晰的看到新建的Scrapy文件如下图所示。


手把手教你如何新建scrapy爬虫框架的第一个项目上


6、当然也可以通过Pycharm导入项目的方式进行查看项目文件此时更加的清晰如下图所示。


手把手教你如何新建scrapy爬虫框架的第一个项目上


7、点击各个项目文件可以查看其中的内容其中settings.py文件的内容如下图所示其他的文件内容在此就不再赘述了。


手把手教你如何新建scrapy爬虫框架的第一个项目上


至此第一个Scrapy爬虫项目的创建及Scrapy爬虫项目中的文件解析介绍就先到这里了下一步开始进行Scrapy爬虫项目的进阶内容敬请期待~~

相关文章
|
2月前
|
数据采集 存储 架构师
上进计划 | Python爬虫经典实战项目——电商数据爬取!
在如今这个网购风云从不间歇的时代,购物狂欢持续不断,一年一度的“6.18年中大促”、“11.11购物节”等等成为了网购电商平台的盛宴。在买买买的同时,“如何省钱?”成为了大家最关心的问题。 比价、返利、优惠券都是消费者在网购时的刚需,但在这些“优惠”背后已产生灰色地带。
|
3月前
|
数据采集 存储 数据处理
Scrapy:Python网络爬虫框架的利器
在当今信息时代,网络数据已成为企业和个人获取信息的重要途径。而Python网络爬虫框架Scrapy则成为了网络爬虫工程师的必备工具。本文将介绍Scrapy的概念与实践,以及其在数据采集和处理过程中的应用。
23 1
|
1月前
|
数据采集 Web App开发 搜索推荐
项目配置之道:优化Scrapy参数提升爬虫效率
项目配置之道:优化Scrapy参数提升爬虫效率
|
1月前
|
数据采集 存储 数据可视化
介绍一下常见的爬虫框架或库,如`Scrapy`。
【2月更文挑战第22天】【2月更文挑战第70篇】介绍一下常见的爬虫框架或库,如`Scrapy`。
|
1月前
|
数据采集 存储 数据处理
Python爬虫在Django项目中的数据处理与展示实例
Python爬虫在Django项目中的数据处理与展示实例
|
3月前
|
数据采集 存储 调度
Scrapy:解锁网络爬虫新境界
在当今信息爆炸的时代,获取并处理大量网络数据是互联网行业中至关重要的一环。Python网络爬虫框架Scrapy作为一款高效、灵活的工具,为开发者提供了强大的能力来抓取、解析和存储各类网页信息。本文将介绍Scrapy的概念、主要特点以及实践经验,帮助读者掌握这一工具,并在实际项目中应用。
|
3月前
|
数据采集 存储 机器人
Scrapy网络爬虫框架——从入门到实践
网络爬虫已经成为了信息获取的必备工具之一,而Scrapy作为Python中最流行的网络爬虫框架之一,具有高效、可扩展、易用等特点。本文将深入介绍Scrapy框架的概念和实践,帮助读者快速掌握构建高质量网络爬虫的方法。
59 0
|
3月前
|
数据采集 存储 调度
Scrapy:从入门到实践的网络爬虫框架
Scrapy是一款强大的Python网络爬虫框架,可以帮助开发者更高效地抓取互联网上的数据。本文将介绍Scrapy的概念和基本原理,详细讲解如何使用Scrapy框架实现一个简单的网络爬虫,并分享一些实战经验和技巧。
|
3月前
|
数据采集 存储 调度
Scrapy:高效的Python网络爬虫框架
在信息时代,数据的获取和分析已经成为了一项重要的技能。而网络爬虫则是实现数据采集的一种常用手段。Scrapy作为一个高效、灵活的Python网络爬虫框架,其具备强大的扩展性、高度的可配置性以及良好的兼容性。本文将从Scrapy的概念入手,介绍其基本原理、使用方法以及实际应用案例。
|
12天前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。