文档备案控制台

开发者社区问答正文

python爬虫一般流程是分为几步，分别是什么呢？

python爬虫一般流程是分为几步，分别是什么呢？

展开

收起

游客5gwrmn6pzajfm 2021-11-05 22:00:28 1321 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客ckw3wjaz7nsko

1.初始一批URL，将这些URL放到待爬取队列 2.从队列中取出这些URL，通过DNS解析IP，到对应IP站点下载HYML页面保存在本地服务器中，爬取完的URL放到已爬取队列 3.分析这些网页内容，找到网页里面的其他关系的URl链接，继续执行第2步，直到爬取条件结束

2021-11-05 22:04:51

赞同展开评论

问答分类：

数据采集 Python

问答标签：

Python爬虫 Python流程爬虫python Python爬虫流程爬虫流程

问答地址：

开发者社区 > 大数据 > 问答

相关问答

DataWorks基于python语言，在dataworks自定义UDF函数的具体流程？

899

6

0

云数据仓库ADB中用 python 写自定义函数，是什么流程呀？

382

1

0

用python写爬虫，有什么好的建议？数据量大了有什么好的处理方式？

195

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

235

1

0

python 除了做爬虫，人工智能，机器学习之外。还在哪些方面有优势？

207

1

0

能大概讲一下Dataphin这个流程吗，你说的是python来获取一个token，然后token怎么

304

1

0

我需要用python来处理这张表的字段，怎么个流程？

279

1

0

python爬虫的方法有哪些？

928

0

0

python爬虫的好方法都有哪些

1072

0

0

爬虫的基本流程是什么呢?

1391

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

idea qoder cn报错

qoder cn 积分为什么消耗这么快???

相关文章

GES DISC 的 OMI/Aura 和 MODIS/Aqua Aerosol 地理托管产品 1-Orbit L2 Swath 13x24 km V003 (OMMYDAGEO)

阿里云国际站：为什么DDoS告警频繁触发？

我给Codex做了一套QQ皮肤，还能自由切换

我亲手训练了一个AI来测Bug，结果它发现了CTO十年前留下的“屎山”

还有其他疑问?