备案控制台

开发者社区彭世瑜的博客文章正文

Python爬虫：selenium打开新窗口和多窗口切换

2022-09-02 981

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python爬虫：selenium打开新窗口和多窗口切换

网上说可以通过发送按键事件触发，比如ctrl+T，不过我没成功，使用了js打开新窗口的方式

代码示例

# -*- coding: utf-8 -*-
# @File    : switch_tab.py
# @Date    : 2018-07-27
# @Author  : Peng Shiyu
import time
from selenium import webdriver
browser = webdriver.Chrome()
# 在当前浏览器中访问百度
browser.get('https://www.baidu.com')
# 新开一个窗口，通过执行js来新开一个窗口
js = 'window.open("https://www.sogou.com");'
browser.execute_script(js)
# 输出当前窗口句柄（百度）
baidu_handle = browser.current_window_handle
# 获取当前窗口句柄集合（列表类型）
handles = browser.window_handles
print(handles)  # 输出句柄集合
# ['CDwindow-E9B85270B51D42AF7369D81B9AA70FFE',
# 'CDwindow-90004FD79A0F59EE057846B34D0E7327']
# 获取搜狗窗口
sogou_handle = None
for handle in handles:
    if handle != baidu_handle:
        sogou_handle = handle
# 输出当前窗口句柄（搜狗）
print('switch to ', handle)
browser.switch_to.window(sogou_handle)
time.sleep(10)
browser.close() #关闭当前窗口（搜狗）
# 切换回百度窗口
browser.switch_to.window(baidu_handle)
time.sleep(10)
browser.quit()

文章标签：

JavaScript

Python

数据采集

关键词：

爬虫python

Python爬虫

Selenium python

Python Selenium

Selenium爬虫

码农技术君

目录

相关文章

小白学大数据

|

1天前

|

数据采集前端开发 JavaScript

Python爬虫技术：动态JavaScript加载音频的解析

Python爬虫技术：动态JavaScript加载音频的解析

小白学大数据

14 0 0

奔跑的数据

|

1天前

|

数据采集 Web App开发数据处理

一步步教你用Python Selenium抓取动态网页任意行数据

使用Python Selenium爬取动态网页，结合代理IP提升抓取效率。安装Selenium，配置代理（如亿牛云），设置User-Agent和Cookies以模拟用户行为。示例代码展示如何使用XPath提取表格数据，处理异常，并通过隐式等待确保页面加载完成。代理、模拟浏览器行为和正确配置增强爬虫性能和成功率。

奔跑的数据

18 3 3

一步步教你用Python Selenium抓取动态网页任意行数据

郑小健

|

4天前

|

数据采集存储数据挖掘

Python网络爬虫实战：抓取并分析网页数据

使用Python的`requests`和`BeautifulSoup`，本文演示了一个简单的网络爬虫，抓取天气网站数据并进行分析。步骤包括发送HTTP请求获取HTML，解析HTML提取温度和湿度信息，以及计算平均温度。注意事项涉及遵守robots.txt、控制请求频率及处理动态内容。此基础爬虫展示了数据自动收集和初步分析的基础流程。【6月更文挑战第14天】

郑小健

66 9 9

东方睿赢

|

10天前

|

数据采集存储中间件

Scrapy，作为一款强大的Python网络爬虫框架，凭借其高效、灵活、易扩展的特性，深受开发者的喜爱

【6月更文挑战第10天】Scrapy是Python的高效爬虫框架，以其异步处理、多线程及中间件机制提升爬取效率。它提供丰富组件和API，支持灵活的数据抓取、清洗、存储，可扩展到各种数据库。通过自定义组件，Scrapy能适应动态网页和应对反爬策略，同时与数据分析库集成进行复杂分析。但需注意遵守法律法规和道德规范，以合法合规的方式进行爬虫开发。随着技术发展，Scrapy在数据收集领域将持续发挥关键作用。

东方睿赢

49 4 4

Onebound19970109110

|

13天前

|

数据采集存储 Web App开发

Python爬虫实战：从入门到精通

Python是开发网络爬虫的首选语言，因其简洁语法和丰富库如requests, BeautifulSoup, Scrapy。爬虫涉及HTTP交互、HTML解析及法律道德问题。以下是爬取豆瓣电影Top250的步骤：确定目标，分析网站，安装必要库（requests, BeautifulSoup），编写代码抓取电影名称、评分和简介，处理异常并优化，如设置请求间隔、使用代理IP和遵循Robots协议。

Onebound19970109110

19 0 0

小白学大数据

|

16天前

|

数据采集 JSON API

自动化Reddit图片收集：Python爬虫技巧

自动化Reddit图片收集：Python爬虫技巧

小白学大数据

35 5 5

奔跑的数据

|

22天前

|

数据采集存储 C++

单线程 vs 多进程：Python网络爬虫效率对比

本文探讨了Python网络爬虫中的单线程与多进程应用。单线程爬虫实现简单，但处理速度慢，无法充分利用多核CPU。而多进程爬虫通过并行处理提高效率，更适合现代多核架构。代码示例展示了如何使用代理IP实现单线程和多进程爬虫，显示了多进程在效率上的优势。实际使用时还需考虑代理稳定性和反爬策略。

奔跑的数据

45 0 0

单线程 vs 多进程：Python网络爬虫效率对比

愿天堂没有BUG（公众号同名）

|

23天前

|

数据采集存储中间件

Python高效爬虫——scrapy介绍与使用

Scrapy是一个快速且高效的网页抓取框架，用于抓取网站并从中提取结构化数据。它可用于多种用途，从数据挖掘到监控和自动化测试。相比于自己通过requests等模块开发爬虫，scrapy能极大的提高开发效率，包括且不限于以下原因： 1. 它是一个异步框架，并且能通过配置调节并发量，还可以针对域名或ip进行精准控制 2. 内置了xpath等提取器，方便提取结构化数据 3. 有爬虫中间件和下载中间件，可以轻松地添加、修改或删除请求和响应的处理逻辑，从而增强了框架的可扩展性 4. 通过管道方式存储数据，更加方便快捷的开发各种数据储存方式

愿天堂没有BUG（公众号同名）

41 2 2

ma_no_lo

|

23天前

|

数据采集 XML 前端开发

Python爬虫：BeautifulSoup

这篇内容介绍了Python中BeautifulSoup库的安装和使用。首先，通过在命令行输入`pip install bs4`进行安装，或使用清华源加速。接着讲解BeautifulSoup的基本概念，它是一个用于数据解析的工具，便于处理HTML和XML文档。与正则表达式不同，BeautifulSoup提供更方便的方式来查找和操作标签及其属性。文章详细阐述了BeautifulSoup的两个主要方法：`find`和`find_all`。`find`方法用于查找单个指定标签，可结合属性字典进行精确选择；`find_all`则返回所有匹配标签的列表。通过这些方法，可以方便地遍历和提取网页元素。

ma_no_lo

28 0 0

ma_no_lo

|

23天前

|

数据采集前端开发 JavaScript

Python爬虫入门

网络爬虫是自动抓取网页数据的程序，通过URL获取网页源代码并用正则表达式提取所需信息。反爬机制是网站为防止爬取数据设置的障碍，而反反爬是对这些机制的对策。`robots.txt`文件规定了网站可爬取的数据。基础爬虫示例使用Python的`urllib.request`模块。HTTP协议涉及请求和响应，包括状态码、头部和主体。`Requests`模块是Python中常用的HTTP库，能方便地进行GET和POST请求。POST请求常用于隐式提交表单数据，适用于需要发送复杂数据的情况。

ma_no_lo

23 1 1

热门文章

最新文章

Python爬虫技术与数据可视化：Numpy、pandas、Matplotlib的黄金组合

高德地图爬虫实践：Java多线程并发处理策略

【AI大模型应用开发】【LangChain系列】实战案例2：通过URL加载网页内容 - LangChain对爬虫功能的封装

Golang爬虫代理接入的技术与实践

【专栏】随着技术发展，Scrapy将在网络爬虫领域持续发挥关键作用

Python爬虫面试：requests、BeautifulSoup与Scrapy详解

SOCKS5代理IP：为什么它是网络爬虫的首选？

静态代理IP对反爬虫策略的应对，以及静态ip对爬虫的助力

新浪明星日志推荐系统——爬虫爬取数据（1）

利用 Heritrix 构建特定站点爬虫

Python random模块（获取随机数）常用方法和使用例子

【Python小技巧】通过实例说明推导式，条件表达式和Lambda函数

Python中魔术方法汇总

一键实现数据采集和存储：Python爬虫、Pandas和Excel的应用技巧

Python tqdm使用方法

Python类(class)中self的理解

Pandas基本操作：Series和DataFrame（Python）

NumPy的基本操作（Python）

各种排序算法及Python源代码

Python类定义：从小白到专家的旅程

相关课程

更多

Python Web开发基础

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

相关实验场景

更多

Python新手入门

Python入门

Python选择及循环结构

Python新手入门（Anolis OS）

Python网络通信程序典型应用

下一篇

基于函数计算模板部署AI应用实践