抓包分析技术精讲|学习笔记

简介: 快速学习抓包分析技术精讲

开发者学堂课程【Python网络爬虫实战抓包分析技术精讲】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/531/detail/7146


抓包分析技术精讲

内容介绍:

一、Fiddler安装与使用简介

二、使用Fiddler抓取HTTPS协议的网页

三、使用抓包分析获取腾讯视频评论数据


一、Fiddler安装与使用简介

Fiddler是一款使用起来非常方便的抓包工具,安装起来也很方便,但安装好之后需要进行相应配置。

抓包原理:

image.png

安装后配置不好没有数据。

配置:

1.在火狐浏览器中点击选项进入之后搜索网络

image.png

2.找到网络代理后点击设置

image.png

设置为下图所示

image.png

然后就配置完成了


二、使用Fiddler抓取HTTPS协议的网页

Fiddler如果不配置是不支持抓取https的网页的,接下来介绍如何让Fiddler支持抓取https的网页。

如果配置的时候,出现各种莫名奇妙的问题,可以参照解决:https://weibo.com/ttarticle/p/show

id=2309404103263770292716

在Fiddler中找到Tool点击Telerik Fiddler Options

image.png

把下列选项全部勾选

image.png

点击Actions中的Export Root Certificate to Desktop

image.png

点击后将证书导出到桌面

image.png

接下来需要将证书安装到浏览器中,点击浏览器选项输入证书搜索

image.png

点击查看证书中的证书机构并导入

image.png

导入之后点击确定即完成证书的导入。

重新进入就可以抓取HTTPS的数据。

使用抓包分析获取腾讯视频评论数据

目标站点: https://v.qq.com

目标数据:某部电影或电视剧的评论数据

要求:实现自动加载新评论

import urllib.request

import re

cid="6375489932584768380"

for i in range(0,100):

print(”第"+str(i+1)+”页的评论数据")

url="htpst//idec.coralgg.com/verticle/2461939412/comment/v2?calback=varticle2461939412commentv2&orinum=

10&oriorder=o&pageflag=1&cursor=”+str(cid)+”&scorecursor=0&oriepnum-2&reporder-o&reppageflag-1&source-9&_ =1521657428371

data=urllib.request.urlopen(url).read().decode("utf-8","ignore")

pat1=' "content" : "(.*?) "'

comment=re.compile (pat1,re.s) . findall(data)

for item in comment :

print(str(item))

print("------")

pat2='"last" : " (.*?)"'

cid=re.compile(pat2,re.S).findall(data)[0]

相关文章
|
存储 监控 Java
一篇文章带你搞懂SkyWalking调用链追踪框架
介绍了Skywalking的作用,安装方法,架构设计等等
一篇文章带你搞懂SkyWalking调用链追踪框架
|
数据采集 数据可视化 数据挖掘
如何提升个人数据分析技能?
【8月更文挑战第7天】如何提升个人数据分析技能?
295 4
|
3月前
|
机器学习/深度学习 人工智能 运维
阿里云PAI人工智能平台介绍、优势及收费标准,手动整理
阿里云人工智能平台PAI是面向开发者和企业的机器学习与深度学习工程平台,提供数据标注、模型构建、训练、部署及推理优化等全链路服务。内置140+优化算法,支持PyTorch、TensorFlow等多种框架,具备高性能训练与推理能力,适用于自动驾驶、金融风控、智能推荐、智慧医疗等多个行业场景。PAI提供零代码开发、可视化建模、大模型一键部署等功能,助力企业快速构建AI应用。支持多种购买方式,如按量付费、预付费等,满足不同业务需求。
|
3月前
|
存储 安全 API
亚马逊SP-API入门:海外电商接口调用与国内平台的差异化
亚马逊 SP-API 与国内电商 API 在技术架构、安全机制及开发流程上差异显著。本文对比京东、淘宝等平台,分析接口设计、地域适配、权限管理等核心差异,并结合实战经验提供开发建议,助力开发者高效接入 SP-API,实现全球电商业务拓展。
|
关系型数据库 MySQL 数据库连接
成功解决「MySQL问题1」启动mysql时:发生系统错误5拒绝访问
这篇文章介绍了如何解决启动MySQL服务时遇到的系统错误5(拒绝访问),通过管理员权限启动命令窗口并使用"net start mysql"和"net stop mysql"命令来控制服务。
|
关系型数据库 应用服务中间件 数据库
Harbor高可用集群设计及部署(基于离线安装方式二)
基于Harbor离线安装方式的高可用方案设计及部署。
756 0
|
边缘计算 网络协议 网络架构
带你读《互联网协议第六版 (IPv 6)》第三章IPv6过渡技术3.3 IPv6 过渡技术(二)
带你读《互联网协议第六版 (IPv 6)》第三章IPv6过渡技术3.3 IPv6 过渡技术
带你读《互联网协议第六版 (IPv 6)》第三章IPv6过渡技术3.3  IPv6 过渡技术(二)
|
NoSQL Redis 数据安全/隐私保护
Redis (error) NOAUTH Authentication required解决方案
Redis (error) NOAUTH Authentication required解决方案
527 0
|
Java Linux Apache
AMQP协议介绍
AMQP协议介绍 AMQP,即Advanced Message Queuing Protocol,高级消息队列协议,是应用层协议的一个开放标准,为面向消息的中间件设计。
4660 0