备案控制台

开发者社区开发与运维文章正文

scrapy中使用senlenium

2023-12-24 58 发布于江苏

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： scrapy中使用senlenium

在爬虫文件中

 def __init__(self):
        self.bro = Chrome() # 默认路径为python.exe所在文件夹

        
          
        
        
        
          
          AI 代码解读

中间件文件,在类中

    def process_response(self, request, response, spider): #spider便是爬虫文件中的类
        bro = spider.bro # 获取爬虫文件中定义的浏览器对象
        new_url = spider.start_urls[0]  # 需要的url
        bro.get(new_url)
        time.sleep(3)
        page_text = bro.page_source # 包含动态加载的数据
        new_response = HtmlResponse(url=new_url,body=page_text,encoding='utf-8',request=request)
        return new_response

        
          
        
        
        
          
          AI 代码解读

在setting中开启中间件

DOWNLOADER_MIDDLEWARES = {
   'servant_pic.middlewares.ServantPicDownloaderMiddleware': 543,
}

        
          
        
        
        
          
          AI 代码解读

文章标签：

Python

中间件

数据采集

叶安义

+关注

目录

打赏

0

0

0

0

2

相关文章

途途途途

|

9月前

|

存储数据采集中间件

scrapy实战2586个小姐姐带回家

scrapy实战2586个小姐姐带回家

途途途途

77 3 3

scrapy实战2586个小姐姐带回家

bruce_xiaowei

|

7月前

|

数据采集中间件数据挖掘

Scrapy 爬虫框架（一）

Scrapy 爬虫框架（一）

bruce_xiaowei

103 0 0

算精通

|

9月前

|

数据采集 JSON Shell

【8月更文挑战第15天】

算精通

70 2 2

Echo_Wish

|

数据采集 Web App开发中间件

Scrapy爬虫框架

Scrapy爬虫框架

Echo_Wish

148 1 1

syst1_m

|

数据采集存储数据挖掘

scrapy介绍

syst1_m

134 0 0

HelloTech技术派

|

数据采集 JSON 前端开发

Scrapy 的初步认识

Scrapy 是一个高级的 Python 爬虫框架，它不仅包含了爬虫的特性，还可以方便的将爬虫获取的数据保存到 csv、json 等文件中。 Scrapy 使用了 Twisted 作为框架，Twisted 是事件驱动的，对于会阻塞线程的操作（访问文件、数据库等），比较适合异步的代码。

HelloTech技术派

123 0 0

小鱼儿编程

|

数据采集存储中间件

Scrapy基础详解

Scrapy基础详解

小鱼儿编程

273 0 0

码农技术君

|

数据采集存储 JSON

scrapy学习

码农技术君

240 0 0

喵叔哟

|

XML Ubuntu 安全

二、安装 Scrapy

二、安装 Scrapy

喵叔哟

244 0 0

python之战

|

数据采集算法中间件

scrapy相关专题总结

本月的scrapy已经写完，关于scrapy写了常用的中间件、数据管道、以及scrapy的相关源码，但是感觉可写的内容不是很多，要门是使用相关的要么是一些不用关注的源码。所以写完scrapy之后还写了些一些其他内容，算是在充数吧，同时预下一个专题是python的数据结构和算法，将对九大算法及其常用数据结构分享，同时将算法应用于数据结构上。

python之战

1724 0 0

热门文章

最新文章

解决删除文件时出现“该项目不在XX中，请确认该项目的位置然后重试”的提示

业内首次融合数据仓库与数据湖阿里云推出下一代大数据平台 “湖仓一体”

阿里云大使推广及积分规则

Element UI - v-infinite-scroll无限滚动组件

分布式 PostgreSQL - Citus 架构及概念

屏幕“眩光”问题或得缓解，科学家研究出类似飞蛾眼睛结构的薄膜

Gartner：物联网应以服务用户为出发点

《认知设计：提升学习体验的艺术》——学习者的情境

由Android的fastboot no permissions而引出的Linux特殊权限管理之：SUID、SGID、SBIT

Directx11教程(47) alpha blend(4)-雾的实现

A2A与MCP：理解它们的区别以及何时使用

RunnerGo API 性能测试实战：从问题到解决的全链路剖析

开发者急盼！Cisco Packet Tracer超详细下载安装教程，附中文版插件使用步骤！

通信协议：数字世界的隐形语言——从基础认知到工程实践-优雅草卓伊凡

MCP协议深度解析：原理、应用与物联网时代的机遇-优雅草卓伊凡

《React Hooks深度解码：重塑状态与副作用管理的底层逻辑》

《深入Vue的异步世界：解锁$nextTick的奥秘与应用》

《前端定位探秘：fixed定位的深度剖析与transform的神秘影响》

《从线性到二维：CSS Grid与Flex的布局范式革命与差异解析》

《解锁CSS Flex布局：重塑现代网页布局的底层逻辑》

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云oss简介和如何对接使用