Python爬虫入门教程 42-100 爬取儿歌多多APP数据-手机APP爬虫部分-阿里云开发者社区

Python爬虫入门教程 42-100 爬取儿歌多多APP数据-手机APP爬虫部分

2019-05-26 2507

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 1. 儿歌多多APP简单分析今天是手机APP数据爬取的第一篇案例博客，我找到了一个儿歌多多APP，没有加固，没有加壳，没有加密参数，对新手来说，比较友好，咱就拿它练练手，熟悉一下Fiddler和夜神模拟器是如何配合着使用的。

1. 儿歌多多APP简单分析

今天是手机APP数据爬取的第一篇案例博客，我找到了一个儿歌多多APP，没有加固，没有加壳，没有加密参数，对新手来说，比较友好，咱就拿它练练手，熟悉一下Fiddler和夜神模拟器是如何配合着使用的。

儿歌多多APP在豌豆荚的下载量还是可以的，一家做内容的APP。

2. APP安装和使用

APP直接去下载APK包就可以了，拖拽到夜神模拟器就安装成功了。在模拟器打开出现如下界面，表示已经可以开始操作了,非常儿童的APP。

3. 抓包测试

打开APP同时，打开Fiddler，首先测试一下网络是否正常，用模拟器自带的浏览器去访问百度，如果可以访问表示无问题，否则重新设置代理

运行软件过程中，注意观察Fiddler，如果出现JSON类型的API[接口]，就要注意了，你想要的数据就在这里

我们点击链接，看Fiddler右侧显示内容，主要看我标注的3处重点

分别是链接，请求头，响应内容

4. 提取接口链接

获取到上述地址之后，你就可以提取接口地址了，提取到的接口很长，需要我们进行关键参数的判定

http://bb.ergeduoduo.com/baby/bb.php?type=getvideos&collectid=29&interver=8&page=1&pagesize=30&grade=-1_-1&user=866174010820641&prod=childstory_ar_4.0.5.0&corp=duoduo&source=childstory_ar_4.0.5.0_m360&srcver=story&ver=1&imei=866174010820641&protect=1

经过一系列的测试，缩短链接如下

http://bb.ergeduoduo.com/baby/bb.php?type=getvideos&collectid=29&page=1&pagesize=30

关键参数

type # 获取内容类型
collectid # 分类
page = 1 # 页码
pagesize = 30 # 每页数据

5. 儿歌多多APP数据爬虫编写

关键地址拿到之后，下面的操作就是选择一个你熟悉的爬虫库去进行操作了，你可以使用scrapy,pyspider 等，也可以直接用requests直接去爬取，都是非常简单的，我就不进行爬虫部分的编写了~

6. 本篇博客重点内容

通过儿歌多多，希望你可以把Fiddler和夜神模拟器之间的配合进行抓包。工具使用熟练，只要接口被我们获取到，关键参数被我们提取到，我们就可以快速的编写爬虫去获取它内部的数据了。

在爬取的过程中，还可以直接去下载视频哦

更多内容，欢迎关注 https://dwz.cn/r4lCXEuL

Python爬虫入门教程 42-100 爬取儿歌多多APP数据-手机APP爬虫部分

1. 儿歌多多APP简单分析

2. APP安装和使用

3. 抓包测试

4. 提取接口链接

5. 儿歌多多APP数据爬虫编写

6. 本篇博客重点内容

Python技术进阶

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Python爬虫入门教程 42-100 爬取儿歌多多APP数据-手机APP爬虫部分

1. 儿歌多多APP简单分析

2. APP安装和使用

3. 抓包测试

4. 提取接口链接

5. 儿歌多多APP数据爬虫编写

6. 本篇博客重点内容

Python技术进阶

热门文章

最新文章

相关课程

相关电子书

推荐镜像