文档备案控制台

开发者社区开发与运维文章正文

ajax-hook+ selenium抓取带参数的 Ajax 数据

2023-02-27 332

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ajax-hook+ selenium抓取带参数的 Ajax 数据

环境

依赖安装

pip install flask-cors flask selenium

安装chromedriver

mac下安装selenium+phantomjs+chromedriver

实现代码

1、hook.js

监听 XMLHttpRequest 请求

// 打开链接，复制代码到这里

// https://unpkg.com/ajax-hook@;2.0.3/dist/ajaxhook.min.js
// https://unpkg.com/axios/dist/axios.min.js

ah.proxy({
//请求成功后进入
onResponse: (response, handler) => {
if (response.config.url.startsWith('/api/movie')) {
axios.post;margin:0px;padding:0px;background:none 0% 0% / auto repeat scroll padding-box border-box rgba( 0 , 0 , 0 , 0 )"> url: window.location.href,
data: response.response
})
console.log(response.response)
handler.next(response)
}
}
})

2、main.py

驱动chrome

# -- coding: utf-8 --
from selenium import webdriver
import time

browser = webdriver.Chrome()
browser.getbrowser.execute_script(open('hook.js').read())
time.sleep(2)

for index in range(3):
    print('current page', index)
    btn_next = browser.find_element_by_css_selector('.btn-next')
    btn_next.click()
    time.sleep(2)

browser.close()
browser.quit()

3、server.py

接收数据的服务，可以进一步将数据存入数据库

# -- coding: utf-8 --
import json
from flask import Flask, request, jsonify
from flask_cors import CORS

app = Flask(__name__)
CORS(app)


@app.route('/receiver/movie', methods=['POST'])
def receive():
    content = json.loads(request.data)
    print(content)
    # to something
    return jsonify({'status': True})


if name == '__main__':
    app.run(host='0.0.0.0', port=5000, debug=True)

参考

如何用 Hook 实时处理和保存 Ajax 数据

            </div>

文章标签：

前端开发

Web App开发

API

数据库

关键词：

Selenium抓取

ajax数据

抓取ajax

抓取ajax数据

Selenium数据

auqbllxiu

目录

相关文章

游客tsrksm3mlhq4y

|

XML JSON 前端开发

ajax中get和post的区别，datatype返回的数据类型有哪些？web开发中数据提交的几种方式，有什么区别。

ajax的讲解

游客tsrksm3mlhq4y

703 0 0

小白学大数据

|

数据采集 Web App开发 JavaScript

基于Selenium的Python爬虫抓取动态App图片

基于Selenium的Python爬虫抓取动态App图片

小白学大数据

1128 68 69

小白学大数据

|

数据采集 Web App开发 JavaScript

利用Selenium和XPath抓取JavaScript动态加载内容的实践案例

利用Selenium和XPath抓取JavaScript动态加载内容的实践案例

小白学大数据

1071 2 2

小白学大数据

|

数据采集 Web App开发 XML

爬虫进阶：Selenium与Ajax的无缝集成

爬虫进阶：Selenium与Ajax的无缝集成

小白学大数据

470 0 0

小白学大数据

|

Web App开发数据采集前端开发

Python + Chrome 爬虫：如何抓取 AJAX 动态加载数据？

Python + Chrome 爬虫：如何抓取 AJAX 动态加载数据？

小白学大数据

747 2 2

众所周知

|

XML 前端开发 JavaScript

PHP与Ajax在Web开发中的交互技术。PHP作为服务器端脚本语言，处理数据和业务逻辑

本文深入探讨了PHP与Ajax在Web开发中的交互技术。PHP作为服务器端脚本语言，处理数据和业务逻辑；Ajax则通过异步请求实现页面无刷新更新。文中详细介绍了两者的工作原理、数据传输格式选择、具体实现方法及实际应用案例，如实时数据更新、表单验证与提交、动态加载内容等。同时，针对跨域问题、数据安全与性能优化提出了建议。总结指出，PHP与Ajax的结合能显著提升Web应用的效率和用户体验。

众所周知

429 3 3

奔跑的数据

|

数据采集 Python

如何用Python Selenium和WebDriver抓取LinkedIn数据并保存登录状态

本文介绍了使用Python Selenium和WebDriver库抓取LinkedIn数据的方法。首先，安装Selenium库和对应的WebDriver，然后配置爬虫代理IP以避免频繁请求被检测。接下来，设置user-agent和cookies以模拟真实用户行为，实现登录并保持状态。登录后，使用WebDriver抓取目标页面数据，如用户名、年龄、性别和简历信息。最后，强调了优化代码、处理异常和遵守使用条款的重要性，以提高效率并避免账号被封禁。

奔跑的数据

812 2 2

如何用Python Selenium和WebDriver抓取LinkedIn数据并保存登录状态

奔跑的数据

|

数据采集 Web App开发 JavaScript

Selenium爬虫技术：如何模拟鼠标悬停抓取动态内容

本文介绍了如何使用Selenium爬虫技术抓取抖音评论，通过模拟鼠标悬停操作和结合代理IP、Cookie及User-Agent设置，有效应对动态内容加载和反爬机制。代码示例展示了具体实现步骤，帮助读者掌握这一实用技能。

奔跑的数据

883 0 0

Selenium爬虫技术：如何模拟鼠标悬停抓取动态内容

jianz123

|

JSON 前端开发数据格式

layui 穿梭框transfer组件数据data用ajax来获取

layui 穿梭框transfer组件数据data用ajax来获取

jianz123

682 2 2

bruce_xiaowei

|

Web App开发前端开发 JavaScript

Python编程—Ajax数据爬取（一）

Python编程—Ajax数据爬取（一）

bruce_xiaowei

393 0 0

热门文章

最新文章

[python爬虫] Selenium爬取新浪微博内容及用户信息

selenium 4.0学习（一）环境部署及脚本demo！

selenium-CSS与XPATH常用元素定位方法

python网络爬虫selenium打开多窗口与切换页面

selenium--更改标签的属性值

软件测试/人工智能|解决Selenium中的异常问题：“error sending request for url”

Python爬虫教程：Selenium可视化爬虫的快速入门

使用 Scrapy + Selenium 爬取动态渲染的页面

编程题+集合+函数+Python特性等等） Selenium相关

Java Selenium封装--RemoteWebElement

在火狐浏览器调ajax获取json数据时，控制台提示“XML 解析错误：格式不佳”。

ajax的优缺点？

Ajax的使用方法

ajax请求方法以及参数！

Ajax(vue-resource)

Django 模板中使用 Ajax POST

浏览器跨域限制：为什么浏览器不能跨域发送Ajax请求？

探秘 AJAX：让网页变得更智能的异步技术(下)

相关课程

更多

Ajax 前端开发入门与实战

Ajax入门

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！