备案控制台

开发者社区开发与运维文章正文

通过爬虫中的selenium控制chrome,Firefox等浏览器自动操作获取相关信息

2022-04-12 1014

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在pycharm中导入selenium之后,我们需要通过命令行来进行操作浏览器

1.首先将我们需要的selenium的包导入fromselenium.webdriverimportChrome(如果使用chrome浏览器就导入chrome,如果使用别的浏览器则将名称换掉即可)
2.创建浏览器对象web=Chrome()
3.打开浏览器web.get("http://www.baidu.com")(此处以百度举例) 
4.找到某个元素. 点击它el=web.find_element_by_xpath('此处是xpath的地址')(xpath不了解的可以看我之前的博客)
el.click()  # 点击事件5.查找某些元素时,我们需要掌握前后端的一些知识,我们可以通过element,class_name,id,tag_name等,主要视情况而定

-6.当执行点击事件时,我们需要导入Keysfromselenium.webdriver.common.keysimportKeys-7.浏览器窗口之间的切换web.switch_to.window(web.window_handles[-1])
表示的是网页栏最后一个网页web.switch_to.window(web.window_handles[0])
表示的是网页栏第一个网页

以下讲的是当网页中存在iframe的网页内嵌的时候:

我们先找到iframe的网址然后进行切换web.get("")
# 处理iframe的话. 必须先拿到iframe. 然后切换视角到iframe . 再然后才可以拿数据iframe=web.find_element_by_xpath('iframe的地址')
web.switch_to.frame(iframe)  # 切换到iframeweb.switch_to.default_content()  # 切换回原页面

无头浏览器的应用:

# 准备好参数配置opt=Options()
opt.add_argument("--headless")
opt.add_argument("--disable-gpu")
web=Chrome(options=opt)  # 把参数配置设置到浏览器中

文章标签：

Python

数据采集

Web App开发

关键词：

Selenium爬虫

Firefox浏览器

浏览器爬虫

Chrome爬虫

Selenium信息

相信光的奥特王小懒

目录

相关文章

奔跑的数据

|

Web App开发数据采集存储

WebDriver与Chrome DevTools Protocol：如何在浏览器自动化中提升效率

本文探讨了如何利用Chrome DevTools Protocol (CDP) 与 Selenium WebDriver 提升浏览器自动化效率，结合代理IP技术高效采集微博数据。通过CDP，开发者可直接操作浏览器底层功能，如网络拦截、性能分析等，增强控制精度。示例代码展示了如何设置代理IP、cookie及user-agent来模拟真实用户行为，提高数据抓取成功率与稳定性。适用于需要频繁抓取互联网数据的应用场景。

奔跑的数据

1136 3 3

WebDriver与Chrome DevTools Protocol：如何在浏览器自动化中提升效率

小白学大数据

|

7月前

|

Web App开发数据采集前端开发

Python + Chrome 爬虫：如何抓取 AJAX 动态加载数据？

Python + Chrome 爬虫：如何抓取 AJAX 动态加载数据？

小白学大数据

259 2 2

蚝油菜花

|

9月前

|

Web App开发人工智能 JSON

AutoMouser：AI Chrome扩展程序，实时跟踪用户的浏览器操作，自动生成自动化操作脚本

AutoMouser是一款Chrome扩展程序，能够实时跟踪用户交互行为，并基于OpenAI的GPT模型自动生成Selenium测试代码，简化自动化测试流程。

蚝油菜花

531 17 17

AutoMouser：AI Chrome扩展程序，实时跟踪用户的浏览器操作，自动生成自动化操作脚本

我是快乐的嘟嘟

|

12月前

|

Web App开发 JSON 安全

Chrome浏览器的跨域问题

【10月更文挑战第6天】

我是快乐的嘟嘟

1797 123 123

小白学大数据

|

9月前

|

Web App开发数据采集 JavaScript

Chrome浏览器实例的TypeScript自动化脚本

Chrome浏览器实例的TypeScript自动化脚本

小白学大数据

266 1 1

mao29955

|

11月前

|

Web App开发 JavaScript 前端开发

使用 Chrome 浏览器的内存分析工具来检测 JavaScript 中的内存泄漏

【10月更文挑战第25天】利用 Chrome 浏览器的内存分析工具，可以较为准确地检测 JavaScript 中的内存泄漏问题，并帮助我们找出潜在的泄漏点，以便采取相应的解决措施。

mao29955

1234 9 9

小王老师呀

|

11月前

|

Web App开发缓存安全

WIN11 Chrome 双击打不开闪退及Chrome浏览器不能拖拽文件crx

【11月更文挑战第6天】本文介绍了 WIN11 系统中 Chrome 浏览器双击打不开闪退及不能拖拽文件 crx 的原因和解决方法。包括浏览器版本过旧、扩展程序冲突、硬件加速问题、缓存过多、安全软件冲突、系统文件损坏、用户配置文件损坏等问题的解决方案，以及 crx 文件的屏蔽、权限问题和文件格式问题的处理方法。

小王老师呀

2787 2 3

小王老师呀

|

11月前

|

Web App开发 Linux iOS开发

Chrome浏览器如何导出所有书签并导入书签

【11月更文挑战第4天】本文介绍了如何在 Chrome 浏览器中导出和导入书签。导出时，打开书签管理器，点击“整理”按钮选择“导出书签”，保存为 HTML 文件。导入时，同样打开书签管理器，点击“整理”按钮选择“导入书签”，选择之前导出的 HTML 文件即可。其他主流浏览器也支持导入这种格式的书签文件。

小王老师呀

8311 2 2

技能实验室

|

12月前

|

Web App开发 Java

使用java操作浏览器的工具selenium-java和webdriver下载地址

【10月更文挑战第12天】Selenium-java依赖包用于自动化Web测试，版本为3.141.59。ChromeDriver和EdgeDriver分别用于控制Chrome和Edge浏览器，需确保版本与浏览器匹配。示例代码展示了如何使用Selenium-java模拟登录CSDN，包括设置驱动路径、添加Cookies和获取页面源码。

技能实验室

743 6 6

奔跑的数据

|

数据采集 Web App开发测试技术

使用Selenium与WebDriver实现跨浏览器自动化数据抓取

在网络爬虫领域，Selenium与WebDriver是实现跨浏览器自动化数据抓取的利器。本文详细介绍了如何利用Selenium和WebDriver结合代理IP技术提升数据抓取的稳定性和效率。通过设置user-agent和cookie来模拟真实用户行为，避免被网站检测和阻止。文章提供了具体的代码示例，展示了如何配置代理IP、设置user-agent和cookie，并实现了跨浏览器的数据抓取。合理的参数配置能有效减少爬虫被封禁的风险，提高数据抓取效率。

奔跑的数据

1157 6 6

使用Selenium与WebDriver实现跨浏览器自动化数据抓取

热门文章

最新文章

快速搞定Dify+Chrome MCP：打造能操作网页的AI助手

快速掌握Dify+Chrome MCP：打造网页操控AI助手

快速搞定Dify+Chrome MCP：打造能操作网页的AI助手

Win10 Chrome认不出新Emoji？两个扩展搞定显示与输入

火狐(Mozilla Firefox)浏览器安装教程，附火狐(Mozilla Firefox)安装包

介绍一款更好用的selenium自愈工具ReCheck

selenium的封装技术

Selenium爬虫部署七大常见错误及修复方案：从踩坑到避坑的实战指南

高并发Java爬虫的瓶颈分析与动态线程优化方案

协程+连接池：高并发Python爬虫的底层优化逻辑

Apple Safari 26 正式版发布 - macOS 专属浏览器 (独立安装包下载)

Playwright MCP浏览器自动化指南

“所见即所爬”：使用Pyppeteer无头浏览器抓取动态壁纸

Browser Use：打造你的浏览器自动化助手

Browser Use 浏览器自动化 Agent：让浏览器自动为你工作

应对反爬：使用Selenium模拟浏览器抓取12306动态旅游产品

火狐(Mozilla Firefox)浏览器安装教程，附火狐(Mozilla Firefox)安装包

分享一个开源的MCP工具使用的AI Agent 支持常用的AI搜索/地图/金融/浏览器等工具

【最新版】Edge浏览器（官方版）安装包/Edge浏览器（官方版）安装教程

WebView2 控件（基于 Microsoft Edge (Chromium) 的嵌入式浏览器控件），保存资源(图片、脚本、CSS)

相关课程

更多

Python爬虫实战

Python网络爬虫实战

相关电子书

更多

基于浏览器的实时构建探索之路

Python第五讲——关于爬虫如何做js逆向的思路

基于浏览器的实时构建探索之路--玄寂

下一篇

2025云栖大会，阿里云百炼邀请您的参与和见证