五分钟轻松掌握 Python 自动化测试 Selenium

简介: 本文主要介绍了 Selenium 相关内容,主要涉及 Selenium 知识面,从开始的 Python 小案例,到后面的 API 全面了解,以及 Selenium 的常用功能,到最后的 XPATH 以及爬虫的认知。这些内容已经能够全面,且具有实践性。

一、Selenium

selenium 是一个老牌的测试工具和自动化工具,它的用途非常多,掌握这么技能绝对是值得,并且如果有需要切换其他的技术,大致应该是相似的,也就是说从它迁移到别的工具是轻松的。

二、为什么 Selenium 需要驱动器呢?

有些网站渲染的内容是在页面渲染之后,通过 js 加载数据然后更新内容。在此之前我们拿不到页面的内容。我们可以通过浏览器驱动器来操作浏览器获取到页面的内容。再来看看 Selenium 的架构:

三、浏览器驱动器

Selenium 在运行之前需要驱动器,下面是不同浏览器的驱动器:

  • chrome 驱动器下载地址
  • firefox 驱动器下载地址
  • edge 驱动器下载地址
  • safari 官方文档


下载的需要注意版本:不同的浏览器对应不同的, 考虑大概率会用 chrome 但是对于高于 Chrome 115 版本的, chrome 会给你一个 json 端点,自己找需要的版本下载。


下载后,记录文件位置 例如 windows 下: "D:\web-driver\chrome-win64\chrome.exe", chrome 的驱动器在 11.7M 左右,复制一份放在自己的目录下也不大。

四、在 Chrome 中使用 WebDriver 进行测试

selenium 核心就是要得到驱动器 driver,所有的操作都是在驱动器上使用的:

from selenium import webdriver
# 指定驱动程序的位置
driver_path = 'C:\Users\Administrator\Desktop\chromedriver'  # 修改为你的驱动程序路径
driver = webdriver.Chrome(executable_path=driver_path)
driver.get("http://example.com") # 打开网页
print(driver.title) # 打印页面标题
driver.quit() # 关闭浏览器

这段代码也很好解释,webdriver 使用 Chrome 驱动。驱动使用 get 方法获取页面内容,然后打印驱动对象上页面的 title, 然后驱动关闭浏览器。

Chrome 驱动的参数 Opiton

前面我们使用 Chrome 驱动,其实 Chrome 驱动还可以传递众多参数,驱动时 chrome opiton 的一些配置配置参数:

chrome_options.add_argument("--headless") # 无头模式
chrome_options.add_argument("--disable-gpu") # 禁用 gpu 加速
chrome_options.add_argument("--window-size=1920,1080") # 指定窗口大小
chrome_options.add_argument("--disable-extensions") # 禁用扩展
chrome_options.add_argument("--no-sandbox") # 禁用沙盒
chrome_options.add_argument("--ignore-certificate-errors") # 忽略证书错误
chrome_options.add_argument("--proxy-server=http://proxyserver:port") # 设置代理
chrome_options.add_argument("--disable-popup-blocking") #禁用弹出窗口阻止
chrome_options.add_argument("--start-maximized") # 启动时最大化窗口
chrome_options.add_argument("--disable-notifications") # 禁用通知
chrome_options.add_argument("--disable-infobars") #禁用信息栏
chrome_options.add_argument("--user-data-dir=/path/to/profile") # 指定用户数据目录
chrome_options.add_argument("--disable-restore-session-state") # 禁用崩溃恢复提示
chrome_options.add_argument("--mute-audio") # 静音音频

五、页面动态内容的加载

Selenium 处理动态内容是常见的需求,等待 JavaScript 动态加载。如果没有等待内容加载完毕,那么查找元素可能会导致错误。原因也很简单,就是没有加载完成。


等待也可以分为不同的层级,web deriver API 级别的。Python 等待以及页面级的等待。

WebDriverWait 等待

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 初始化 WebDriver
driver = webdriver.Chrome()
# 打开网页
driver.get('http://example.com')
# 显式等待,等待某个元素可见
element = WebDriverWait(driver, 10).until(
    EC.visibility_of_element_located((By.ID, 'dynamicElementId'))
)
# 对元素执行操作
element.click()

driver.find_element 显示等待

driver = webdriver.Chrome()
driver.implicitly_wait(10)  # 全局等待 10 秒
driver.get('http://example.com')
# 如果元素还没准备好,WebDriver 将等待,直到找到元素或超时
element = driver.find_element(By.ID, 'dynamicElementId')
element.click()

time.sleep() Python 等待(不推荐)

import time
driver = webdriver.Chrome()
driver.get('http://example.com')
time.sleep(5)  # 强制等待 5 秒
element = driver.find_element(By.ID, 'dynamicElementId')
element.click()

页面级等待

from selenium.webdriver.support.ui import WebDriverWait
# 等待页面完全加载,通过检查 JavaScript 变量
WebDriverWait(driver, 10).until(
    lambda driver: driver.execute_script('return document.readyState') == 'complete'
)

有了对 selenium 的基础使用和认识,我们就需要较为全面的了解 selenium 的 api 了,当我们对其 api 有较为全面的了解,我们很快就能入手了。

六、selenium 浏览器操作

  • driver.get(url) 打开指定的 URL。
  • driver.quit() 关闭浏览器并结束 WebDriver 会话。
  • driver.close() 关闭当前窗口。
  • driver.maximize_window() 最大化浏览器窗口。
  • driver.execute_script(script) 执行 JavaScript 脚本。

七、元素定位

  • driver.find_element(By.ID, id) 通过 ID 定位元素。
  • driver.find_element(By.NAME, name) 通过 NAME 定位元素。
  • driver.find_element(By.XPATH, xpath) 通过 XPath 定位元素。
  • driver.find_element(By.CSS_SELECTOR, selector) 通过 CSS 选择器定位元素。
  • driver.find_elements(By.CLASS_NAME, class_name) 定位所有符合类名的元素,返回列表。

八、元素操作

  • element.click() 点击元素。
  • element.send_keys(keys) 向元素输入文本。
  • element.clear() 清空输入框的内容。
  • element.get_attribute(attribute) 获取元素的属性值。
  • element.get_text() 获取元素的文本内容。
  • element.is_displayed() 检查元素是否显示。

九、等待操作

  • driver.implicitly_wait(time) 设置全局隐式等待时间。
  • WebDriverWait(driver, time).until(condition) 显式等待指定的条件。

十、窗口与导航

  • driver.back() 导航到前一个页面。
  • driver.forward() 导航到下一个页面。
  • driver.refresh() 刷新当前页面。
  • driver.switch_to.frame(frame) 切换到指定的 iframe。
  • driver.switch_to.alert() 切换到 alert 对话框。
  • driver.switch_to.window(window_name) 切换到指定的窗口。

十一、常用功能

处理 Cookie

cookies = driver.get_cookies()
driver.add_cookie({'name': 'cookie_name', 'value': 'cookie_value'})
driver.delete_all_cookies()

截图

driver.save_screenshot('screenshot.png')

上传图片

file_input = driver.find_element(By.NAME, 'file_upload') file_input.send_keys('/path/to/file.txt')

执行 JS

# 执行 js 脚本
driver.execute_script("alert('Hello, World!');")
# 从 localstorage 中获取 token
token = driver.execute_script("return localStorage.getItem('auth_token');") print(f"Token: {token}")
# 获取元素 css 属性
element = driver.find_element(By.ID, 'element_id')
background_color = driver.execute_script("return window.getComputedStyle(arguments[0]).backgroundColor;", element)

十二、Selenium 与 XPATH

虽然页面里面使用 css 选择器更加靠近 web 端,但是 xpath 在查找元素和定位时更加直接,简单高效。前面已经介绍 api 了,下面是一个实例:

from selenium import webdriver
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
driver.get("https://example.com")
# 使用 XPath 查找元素
element = driver.find_element(By.XPATH, "//div[@id='main-content']//h1")
print(element.text)

find_element 第一个参数指定 By.XPATH,后面传入 xpath 字符串即可,也是特别方便。

十三、selenium 与爬虫

得益于 selenium 能够直接访问实际页面,动态加载数据爬虫也有的重要作用。它可以弥补传统爬虫工具的不足,抓取由 JavaScript 渲染的内容。但要注意的是,它的性能相对较低,不适合大规模数据抓取。

十四、小结

本文主要介绍了 Selenium 相关内容,主要涉及 Selenium 知识面,从开始的 Python 小案例,到后面的 API 全面了解,以及 Selenium 的常用功能,到最后的 XPATH 以及爬虫的认知。这些内容已经能够全面,且具有实践性。

作者:编程杂货铺

链接:https://juejin.cn/post/7402328037390123071

相关文章
|
26天前
|
搜索推荐 Python
使用Python自动化生成物业通知单
本文介绍如何使用Python结合Pandas和python-docx库自动化生成物业通知单。通过读取Excel数据并填充至Word模板,实现高效准确的通知单批量制作。包括环境准备、代码解析及效果展示,适用于物业管理场景。
60 14
|
30天前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
|
4天前
|
Python
自动化微信朋友圈:Python脚本实现自动发布动态
本文介绍如何使用Python脚本自动化发布微信朋友圈动态,节省手动输入的时间。主要依赖`pyautogui`、`time`、`pyperclip`等库,通过模拟鼠标和键盘操作实现自动发布。代码涵盖打开微信、定位朋友圈、准备输入框、模拟打字等功能。虽然该方法能提高效率,但需注意可能违反微信使用条款,存在风险。定期更新脚本以适应微信界面变化也很重要。
104 60
|
13天前
|
Web App开发 数据采集 JavaScript
CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序
本文介绍了Selenium、Chrome DevTools及Chrome DevTools Protocol (CDP) 的基本功能与应用。Selenium是一款开源自动化测试工具,适用于网页端应用程序测试和数据采集,具备跨平台特性。Chrome DevTools内置浏览器中,提供调试、分析Web应用程序的功能,包括元素、控制台、源代码和网络选项卡等。CDP是一套用于与Chromium内核浏览器通信的API,支持自动化测试和性能分析。文中还展示了Selenium与CDP结合使用的示例,如捕获网络请求数据和打印网页内容,并推荐了相关书籍和资源以供深入学习。
114 39
CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序
|
10天前
|
IDE 测试技术 开发工具
10个必备Python调试技巧:从pdb到单元测试的开发效率提升指南
在Python开发中,调试是提升效率的关键技能。本文总结了10个实用的调试方法,涵盖内置调试器pdb、breakpoint()函数、断言机制、logging模块、列表推导式优化、IPython调试、警告机制、IDE调试工具、inspect模块和单元测试框架的应用。通过这些技巧,开发者可以更高效地定位和解决问题,提高代码质量。
98 8
10个必备Python调试技巧:从pdb到单元测试的开发效率提升指南
|
22天前
|
Web App开发 IDE JavaScript
Selenium IDE:Web自动化测试的得力助手
Selenium IDE:Web自动化测试的利器。作为开源工具,Selenium IDE支持录制与回放用户操作,适用于Chrome、Firefox等多浏览器,简化了测试流程,提升了效率,降低了自动化测试的门槛。它还支持导出多种编程语言的脚本,便于测试集成与复用。
75 19
Selenium IDE:Web自动化测试的得力助手
|
24天前
|
Web App开发 IDE 测试技术
Selenium:强大的 Web 自动化测试工具
Selenium 是一款强大的 Web 自动化测试工具,包括 Selenium IDE、WebDriver 和 Grid 三大组件,支持多种编程语言和跨平台操作。它能有效提高测试效率,解决跨浏览器兼容性问题,进行性能测试和数据驱动测试,尽管存在学习曲线较陡、不稳定等缺点,但其优势明显,是自动化测试领域的首选工具。
142 17
Selenium:强大的 Web 自动化测试工具
|
16天前
|
JSON 数据可视化 测试技术
python+requests接口自动化框架的实现
通过以上步骤,我们构建了一个基本的Python+Requests接口自动化测试框架。这个框架具有良好的扩展性,可以根据实际需求进行功能扩展和优化。它不仅能提高测试效率,还能保证接口的稳定性和可靠性,为软件质量提供有力保障。
48 7
|
1月前
|
Android开发 开发者 Python
通过标签清理微信好友:Python自动化脚本解析
微信已成为日常生活中的重要社交工具,但随着使用时间增长,好友列表可能变得臃肿。本文介绍了一个基于 Python 的自动化脚本,利用 `uiautomator2` 库,通过模拟用户操作实现根据标签批量清理微信好友的功能。脚本包括环境准备、类定义、方法实现等部分,详细解析了如何通过标签筛选并删除好友,适合需要批量管理微信好友的用户。
51 7
|
30天前
|
安全 API 文件存储
Yagmail邮件发送库:如何用Python实现自动化邮件营销?
本文详细介绍了如何使用Yagmail库实现自动化邮件营销。Yagmail是一个简洁强大的Python库,能简化邮件发送流程,支持文本、HTML邮件及附件发送,适用于数字营销场景。文章涵盖了Yagmail的基本使用、高级功能、案例分析及最佳实践,帮助读者轻松上手。
35 4