零基础入门Python爬虫不知道怎么学?这是入门的完整教程

简介:

这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源。看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬虫的大门啦~

话不多说,正式开始我们的第一节课《Python环境的安装》吧

同学们开课啦,看黑板,都看黑板~

1. 安装Anaconda

在我们的教学中,我们使用的版本是Python3,至于为什么要选Python3,哼哼!

1240

工欲善其事,必先利其器,在学习爬虫之前,你得先搭建自己的编程环境。废话不多说,按照下面的方法搭建吧:

1.1 下载Anaconda

打开Anaconda网页后,看到这样的页面:

1240

根据你的电脑系统,选择相应版本的 Anaconda(记住选择 Python 3.6 的版本),Mac OS 用户选择 Mac 版本即可,如果不想麻烦,请选择 Graphical Installer。

1.2 安装 Anaconda

选择默认位置安装即可:

1240

两个选择框都勾上,安装:

1240

小编推荐一个学Python的学习裙【 二二七,四三五,四五零 】,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!希望新手少走弯路

1.3 在开始菜单中查看 Anaconda

Anaconda 装好之后,可以在开始菜单查看。可以看到包含了如下图所示的组件:

1240

之后我们会用到的主要是:

Anaconda Prompt:Anaconda 自带的命令行

Jupyter Notebook:一个简单易用、适合入门的 IDE

2. 安装常用包

2.1 安装 Python 包 requests

打开 cmd 终端,输入 pip install requests,若安装不成功,可以尝试:conda install requests

1240

出现 Successfully installed,即表示成功安装。若需检测,先输入 Python,再输入 import requests,未出现报错,表示安装成功,可以正常使用。注:操作完记得退出:quit()。

如果安装时显示 conda 不是内部或外部命令,用下面的方式安装(如未报错则不必用下面的方法)

在开始菜单打开 Anaconda Prompt:

1240

在 Anaconda Prompt 输入 conda install requests:

1240

2.2 安装 Python 包 lxml

同样在终端输入: conda install lxml,出现 Successfully installed,即表示成功安装,若不能成功安装,请尝试如下方法。

前往 http://www.lfd.uci.edu/~gohlke/pythonlibs/,手动下载需要安装的第三方包(注意对应你的python版本是32位还是64位)。

1240

在下载下来的文件所在目录按住shift并点击鼠标右键,选择在此处打开Powershell窗口,在此命令行中使用 pip install + 下载下来文件全名 ,即可完成安装。

1240

所以你该知道如何安装 Python 包了吧,通用方法是,在终端输入:conda install + 包名称 或者 pip install + 包名称。出现特殊的不能安装的情况,可以去下载之后进行安装。

3. Jupyter Notebook

3.1 开启Jupyter Notebook

在开始菜单打开 Jupyter Notebook:

1240

Jupyter 将会在网页中自动打开:

1240

3.2 Jupyter Notebook 界面

Files:你当前工作环境下的所有项目(代码)、默认存储的文件都在这里:

1240

Runing:你目前正在运行的项目都在这里:

1240

3.3 新建一个文档,开始写代码

依次点击右上方 :New > Python 3,即新建了一个 Ipython 文件,如图:

1240

点击上方 Utitled 可以更改文档的名称,下面的空间就可以写代码啦:

1240

3.4 Jupyter Notebook 功能简介

1240

4. 创建第一个实例:爬取百度首页

仅用四行代码,我们就可以把百度首页的内容下载下来:

1.导入 requests 库;2.下载百度首页内容;3.更改编码;4.打印内容

1240

具体爬虫原理及代码的内涵,在下一节的案例中详细讲解~

相关文章
|
11天前
|
数据采集 Python
【python】爬虫-西安医学院-校长信箱
本文以西安医学院-校长信箱为基础来展示爬虫案例。来介绍python爬虫。
【python】爬虫-西安医学院-校长信箱
|
17天前
|
数据采集 安全 Python
python并发编程:Python实现生产者消费者爬虫
python并发编程:Python实现生产者消费者爬虫
24 0
python并发编程:Python实现生产者消费者爬虫
|
29天前
|
JSON C语言 C++
【Python 基础教程 26】Python3标准库全面入门教程:一步步带你深入理解与应用
【Python 基础教程 26】Python3标准库全面入门教程:一步步带你深入理解与应用
61 1
|
23天前
|
Java Python 开发者
Python 学习之路 01基础入门---【Python安装,Python程序基本组成】
线程池详解与异步任务编排使用案例-xian-cheng-chi-xiang-jie-yu-yi-bu-ren-wu-bian-pai-shi-yong-an-li
72 2
Python 学习之路 01基础入门---【Python安装,Python程序基本组成】
|
1天前
|
机器学习/深度学习 数据可视化 数据挖掘
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
10 1
|
1天前
|
人工智能 数据挖掘 程序员
《Python 简易速速上手小册》第1章:Python 编程入门(2024 最新版)
《Python 简易速速上手小册》第1章:Python 编程入门(2024 最新版)
24 0
|
2天前
|
机器学习/深度学习 数据采集 算法
scikit-learn入门指南:从基础到实践
【4月更文挑战第17天】这篇指南介绍了scikit-learn,一个Python数据分析和机器学习的重要库。内容涵盖安装、数据加载与预处理、模型训练(如KNN分类器)、评估、调参优化及高级应用,如降维和聚类。通过实例展示了scikit-learn在分类任务中的使用,强调其在数据科学中的重要性。要深入了解,可参考官方文档和实践案例。
|
3天前
|
程序员 索引 Python
06-python数据容器-set(集合)入门基础操作
06-python数据容器-set(集合)入门基础操作
|
9天前
|
JavaScript 前端开发 API
游戏开发入门:Python后端与Vue前端的协同工作方式
【4月更文挑战第11天】使用Python后端(Flask或Django)和Vue.js前端开发游戏变得流行,能提高开发效率和可维护性。本文指导如何构建这样的项目,包括设置环境、创建虚拟环境、搭建后端API及前端Vue组件,强调前后端协作和API接口的重要性。这种架构促进团队合作,提升代码质量和游戏体验。
|
10天前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
【4月更文挑战第9天】本文介绍了使用Python和Scikit-learn进行机器学习的基础知识和入门实践。首先,简述了机器学习的基本概念和类型。接着,展示了如何安装Python和Scikit-learn,加载与处理数据,选择模型进行训练,以及评估模型性能。通过本文,读者可了解机器学习入门步骤,并借助Python和Scikit-learn开始实践。