文档备案控制台

开发者社区大数据文章正文

用Python爬取分析【某东618】畅销商品销量数据，带你看看大家都喜欢买什么！

2022-05-15 781

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 618购物节，辰哥准备分析一波购物节大家都喜欢买什么？本文以某东为例，Python**爬取**618活动的畅销商品数据，并进行**数据清洗**，最后以**可视化**的方式从不同角度去了解畅销商品中，名列前茅的商品是哪些？销售数据如何？用户好评如何？等等

618购物节，辰哥准备分析一波购物节大家都喜欢买什么？本文以某东为例，Python爬取618活动的畅销商品数据，并进行数据清洗，最后以可视化的方式从不同角度去了解畅销商品中，名列前茅的商品是哪些？销售数据如何？用户好评如何？等等

本文结构如下：

1、爬取某东畅销商品数据

2、清洗数据并并进行简单分析

3、将数据进行可视化展示

数据的字段如下：

一共爬取了243条某东畅销商品数据

01、获取数据

1. 分析网页

在编写代码之前，先来分析一波网页。

上面是某东的畅销商品，通过辰哥分析分析，该网页有异步加载（前面10个商品是静态加载，剩下的是动态异步加载），因此我们需要写了个请求去获取数据。

2. 获取静态网页商品链接

商品的销售、评论等数据在商品详情页，这里先获取商品详情页链接

结果如下：

3. 获取动态网页商品链接

通过抓包可以获取到动态加载链接，并获取到商品标题和商品id（这里的商品id可以用于后面拼接商品详情页链接）

获取json数据后，提取出商品标题和商品ID

4. 获取打折、原价、秒杀价

通过商品ID可以获取到商品打折、原价、秒杀价（这里有接口，接口是通过抓包获取的，感兴趣的可以去自己去尝试，不明白的可以直接使用）

这里将该功能封装成函数，通过传入商品ID就可以获取该商品的商品打折、原价、秒杀价

结果如下：

5. 获取评论数、好评数、中评数、差评数、好评率

通过商品ID可以获取到评论数、好评数、中评数、差评数、好评率（同样这里有接口，接口是通过抓包获取的，感兴趣的可以去自己去尝试，不明白的可以直接使用）

结果如下：

6. 保存到excel

接着开始遍历商品，并通过ID去获取商品的销售情况（步骤4和步骤5的函数），最后把数据保存到execl

定义表头

写入数据

其中的get_price和CommentCount是步骤4和步骤5的函数。count是excel中行数，因此在循环中count+1，依次写入下一行。

最终保存结果

一共爬取了243条某东畅销商品数据

02、数据分析&可视化

1.数据清洗

需要清洗的内容，主要有图中这三列（标题、打折、好评数）。

清洗目标：

标题过长（长度控制在10内），不方便后面的画图
打折字段中含有折字，在进行排序时不能直接转数值型。
好评数中的万，转为具体数值，如1.2万转为12000

清洗结果：

2.可视化-商品打折力度

从清洗后数据中取出：商品名称和打折这两列，进行【排序】从打折最大到打折最小。最后取出前15名进行可视化

核心代码如下:

可视化效果：

3.可视化-好评率统计

从数据中取出：好评率这列，对不同的好评率进行统计，如好评率是100%（1）的商品多少件，好评率99%（0.99）的商品多少件等。

核心代码如下:

可视化效果：

3.可视化-畅销商品销量排行

从数据中取出：商品名称和评论数这两列，这里根据评论数去作为销售依据，对商品的销量进行排序（高到低），并取出前15名进行可视化。

核心代码如下:

可视化效果：

4.可视化-畅销商品前15名原价与秒杀价对比

在上面的分析中可以知道畅销商品的销量前15名，这里将这15件商品的原价和秒杀价进行可视化对比。

核心代码如下:

可视化效果：

03、小结

本文以某东为例，Python爬取618活动的畅销商品数据，并进行数据清洗，最后以可视化的方式从不同角度去了解畅销商品中，名列前茅的商品是哪些？销售数据如何？用户好评如何？等等

不明白的地方可以在下方留言，一起交流。

文章标签：

Python

数据挖掘

数据采集

数据可视化

数据格式

JSON

关键词：

Python分析

Python数据

Python商品数据

Python商品

Python分析商品

Python研究者

目录

相关文章

Q一个好的名字容易让人记住你2483558220

|

9月前

|

存储分布式计算大数据

基于Python大数据的的电商用户行为分析系统

本系统基于Django、Scrapy与Hadoop技术，构建电商用户行为分析平台。通过爬取与处理海量用户数据，实现行为追踪、偏好分析与个性化推荐，助力企业提升营销精准度与用户体验，推动电商智能化发展。

Q一个好的名字容易让人记住你2483558220

1608 4 5

站大爷

|

9月前

|

数据采集 Web App开发数据可视化

Python零基础爬取东方财富网股票行情数据指南

东方财富网数据稳定、反爬宽松，适合爬虫入门。本文详解使用Python抓取股票行情数据，涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化，助你快速掌握金融数据爬取技能。

站大爷

8036 1 3

技术交流18179014480

|

9月前

|

JSON 算法 API

Python采集淘宝商品评论API接口及JSON数据返回全程指南

Python采集淘宝商品评论API接口及JSON数据返回全程指南

技术交流18179014480

1080 136 137

Q一个好的名字容易让人记住你2483558220

|

9月前

|

机器学习/深度学习大数据关系型数据库

基于python大数据的台风灾害分析及预测系统

针对台风灾害预警滞后、精度不足等问题，本研究基于Python与大数据技术，构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率，结合Django框架实现动态可视化与实时预警，为防灾决策提供科学支持，显著提高应急响应效率，具有重要社会经济价值。

Q一个好的名字容易让人记住你2483558220

726 4 4

Q一个好的名字容易让人记住你2483558220

|

9月前

|

机器学习/深度学习大数据关系型数据库

基于python大数据的青少年网络使用情况分析及预测系统

本研究基于Python大数据技术，构建青少年网络行为分析系统，旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据，运用机器学习实现精准行为预测与实时干预，推动数字治理向“数据驱动”转型，为家庭、学校及政府提供科学决策支持，助力青少年健康上网。

Q一个好的名字容易让人记住你2483558220

762 2 2

winx_19970108018

|

数据安全/隐私保护数据格式 Python

python爬取快手商品数据

python爬取快手商品数据

winx_19970108018

1351 1 1

小白学大数据

|

数据采集前端开发搜索推荐

python如何通过分布式爬虫爬取舆情数据

python如何通过分布式爬虫爬取舆情数据

小白学大数据

468 0 0

python如何通过分布式爬虫爬取舆情数据

小白学大数据

|

数据采集前端开发数据挖掘

python多线程爬取汽车数据

python如何使用多线获取网站数据

小白学大数据

768 0 0

python多线程爬取汽车数据

小白学大数据

|

数据采集大数据 Python

python爬取微博热搜评论数据

如何使用pythonp爬取微博热搜上有关的评论数据

小白学大数据

700 0 0

python爬取微博热搜评论数据

热门文章

最新文章

下载python所有的包国内地址

使用Python的pandas和matplotlib库绘制移动平均线（MA）示例

Python爬虫day3.2—python异常处理

如何使用Python和Flask构建一个简单的RESTful API。Flask是一个轻量级的Web框架

折线图应用场景 | Python 数据可视化库 Matplotlib 快速入门之十二

python4--作业

【Python 基础教程 05】超详细解析Python3注释：全面入门教程，初学者必读,了解Python如何进行注释

Python 自动化-pywinauto库定位树结构控件里的树节点实例演示

python的继承

基于python大数据的台风灾害分析及预测系统

基于Python大数据的热门游戏推荐系统

基于python大数据的青少年网络使用情况分析及预测系统

2026版基于python大数据的电影分析可视化系统

基于Python大数据的的电商用户行为分析系统

基于python大数据技术的医疗数据分析与研究

基于python大数据深度学习的酒店评论文本情感分析系统

Python SQLAlchemy模块：从入门到实战的数据库操作指南

基于python大数据的的海洋气象数据可视化平台

基于Python大数据的主流汽车价格分析可视化系统

相关课程

更多

Python Web开发基础

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！