开发者社区大数据文章正文

当当网30日好评榜图书爬虫

2024-09-28 44

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 当当网30日好评榜图书爬虫

今天，大家爬虫练个手：爬取当当网30日好评榜图书，具体网站为：

简单用个requests、bs4就搞定了，具体代码如下：

import requestsimport bs4import re
for i in range(1,26):    url = 'http://bang.dangdang.com/books/fivestars/01.00.00.00.00.00-recent30-0-0-1-' + str(i)    response = requests.get(url)    html=bs4.BeautifulSoup(response.text)    kk=html.select('ul > li > div.name > a')    for ii in kk:#         print(ii.text)        with open('book.txt','a+',encoding='utf-8') as f:            f.write(ii.text+'\n')

完工截图如下：

爬虫时不时拿出来练练手，免得手生了😄，bye！

文章标签：

数据采集

关键词：

图书爬虫

gudanhero2018

2月前

数据采集 Python

爬虫练手：某网图书畅销榜排名数据

gudanhero2018

29 0 0

奶berber

Web App开发数据采集存储

Python爬虫(一)——豆瓣下图书信息

爬虫目的：　　随着近年互联网的发展，网络上的信息飞速数量增长。在庞大的数据面前想要获得期望的信息往往如同大海捞针。通过合理的筛选，在百万甚至数亿计的数据中找到所需信息，无疑有着非常大的意义。　　在豆瓣网下，有很多与日常生活相关的模块网站　　　　内置的评分评价功能可以为用户提供很大选择空间，以豆瓣读书为例：　　　　　　其中包含六个大型模块(文学，流行，文化，生活，经管，科技)，内部细分了145个小型模块。

奶berber

2178 0 0

奶berber

数据采集 Python

Python爬虫(二)——豆瓣图书决策树构建

　　前文参考： https://www.cnblogs.com/LexMoon/p/douban1.html Matplotlib绘制决策树代码： 1 # coding=utf-8 2 import matplotlib.

奶berber

1497 0 0

奶berber

数据采集 Python

Python爬虫(三)——对豆瓣图书各模块评论数与评分图形化分析

文化　　　　　　　　　经管 ....略结论：一个模块的评分与评论数相关，评分为 [8.8——9.2] 之间的书籍评论数往往是模块中最多的

奶berber

1613 0 0

jclian91

数据采集 Python

Scrapy爬虫（5）爬取当当网图书畅销榜

本次将会使用Scrapy来爬取当当网的图书畅销榜，其网页截图如下：我们的爬虫将会把每本书的排名，书名，作者，出版社，价格以及评论数爬取出来，并保存为csv格式的文件。

jclian91

1945 0 0

青衫无名

Web App开发存储数据采集

一个抓取豆瓣图书的开源爬虫的详细步骤

简介基于numpy和bs4的豆瓣图书爬虫，可以分类爬取豆瓣读书300多万本图书信息，包括标题、作者、定价、页数、出版信息等 github地址：https://github.com/lanbing510/DouBanSpider 项目作者：lanbing510 1 可以爬下豆瓣读书标签下的所有图.

青衫无名

3099 0 0

李杰米

数据采集 JavaScript

Python-利用beautifulsoup写个豆瓣热门图书爬虫

　　Anaconda3里边自带了bs4的包，省的我自己安装了。　　最近觉得模块化的写法可以让代码变得清晰易读。而且随着代码的增多，找bug也会更方便。（目前我还写不出这么多）而且模块化有种工具化的思想，拿来主义的思想在里面，使用工具可是人等少数智慧动物的专利啊。

李杰米

1326 0 0

土木林森

10天前

数据采集存储 JSON

Python网络爬虫：Scrapy框架的实战应用与技巧分享

【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理，以及存储爬取的数据。通过具体示例，帮助读者掌握Scrapy的核心功能和使用方法，提升数据采集效率。

土木林森

50 6 6

python编程狮

3月前

机器学习/深度学习数据采集数据可视化

基于爬虫和机器学习的招聘数据分析与可视化系统，python django框架，前端bootstrap，机器学习有八种带有可视化大屏和后台

本文介绍了一个基于Python Django框架和Bootstrap前端技术，集成了机器学习算法和数据可视化的招聘数据分析与可视化系统，该系统通过爬虫技术获取职位信息，并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析，提供了一个直观的可视化大屏和后台管理系统，以优化招聘策略并提升决策质量。

python编程狮

167 4 5

请看我回答~

3月前

数据采集存储搜索推荐

打造个性化网页爬虫：从零开始的Python教程

【8月更文挑战第31天】在数字信息的海洋中，网页爬虫是一艘能够自动搜集网络数据的神奇船只。本文将引导你启航，用Python语言建造属于你自己的网页爬虫。我们将一起探索如何从无到有，一步步构建一个能够抓取、解析并存储网页数据的基础爬虫。文章不仅分享代码，更带你理解背后的逻辑，让你能在遇到问题时自行找到解决方案。无论你是编程新手还是有一定基础的开发者，这篇文章都会为你打开一扇通往数据世界的新窗。

请看我回答~

49 0 0

当当网30日好评榜图书爬虫

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

当当网30日好评榜图书爬虫

热门文章

最新文章

相关课程

相关电子书

相关实验场景