让ChromeDriver 125顺利运行:解决找不到chromedriver.exe的技巧

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,1000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 本文介绍了如何解决Selenium使用ChromeDriver时遇到的版本不匹配问题,以及如何设置环境变量。同时,文章提供了示例代码,展示如何在Python中配置Selenium使用代理IP、设定User-Agent和Cookie进行网页抓取,以提高爬虫的效率和成功率。确保ChromeDriver与Chrome浏览器版本一致,将`chromedriver.exe`添加到环境变量,然后使用`Options`和`Proxy`类配置代理和浏览器选项,最后通过`webdriver.Chrome()`启动浏览器并执行抓取任务。

爬虫代理.jpg

背景/引言

在使用Selenium进行网页自动化或数据抓取时,ChromeDriver是一个不可或缺的工具。然而,有时我们会遇到诸如“ChromeDriver版本125无法找到chromedriver.exe”的错误。本文将详细介绍如何解决这一问题,并提供示例代码,展示如何在Selenium中使用代理IP、设置User-Agent和Cookie来进行数据抓取。

正文

一、确认ChromeDriver版本和路径

首先,确保您下载的ChromeDriver版本与安装的Chrome浏览器版本匹配。可以通过以下步骤进行检查:

  1. 打开Chrome浏览器,输入 chrome://settings/help 查看版本号。
  2. 访问 ChromeDriver官网 下载对应版本的ChromeDriver。

下载完成后,将chromedriver.exe放在一个便于管理的目录下,例如 C:\chromedriver\

二、设置环境变量

为了让系统识别chromedriver.exe,需要将其所在目录添加到环境变量中:

  1. 右键点击“此电脑”或“我的电脑”,选择“属性”。
  2. 点击“高级系统设置”。
  3. 在“系统属性”窗口中,点击“环境变量”。
  4. 在“系统变量”部分,找到Path,并点击“编辑”。
  5. 添加C:\chromedriver\到路径中。

三、使用Selenium和ChromeDriver

确保Python和Selenium库已安装,可以通过以下命令安装:

pip install selenium

下面是一个示例代码,展示了如何使用代理IP、设置User-Agent和Cookie来进行数据抓取。

示例代码

在示例代码中,我们使用了代理IP提高爬取成功率。使用代理IP时,需要配置代理服务器的地址、端口、用户名和密码。本文示例使用了亿牛云爬虫代理的配置方法。

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.proxy import Proxy, ProxyType
from selenium.webdriver.chrome.options import Options

# 设置ChromeDriver的路径
chrome_driver_path = 'C:/chromedriver/chromedriver.exe'

# 配置代理IP
proxy = Proxy()
proxy.proxy_type = ProxyType.MANUAL
proxy.http_proxy = 'proxy.example.com:8080'  # 代理服务器地址和端口
proxy.ssl_proxy = 'proxy.example.com:8080'

# 使用亿牛云爬虫代理
proxy.http_proxy = '域名:端口'
proxy.ssl_proxy = '域名:端口'
proxy.socks_username = '用户名'
proxy.socks_password = '密码'

# 配置Chrome选项
chrome_options = Options()
chrome_options.add_argument("--proxy-server=http://域名:端口")
chrome_options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36")

# 设置Cookies
cookies = {
   
   
    'name': 'value',
    'another_cookie': 'another_value'
}

# 启动ChromeDriver
service = Service(chrome_driver_path)
driver = webdriver.Chrome(service=service, options=chrome_options)

# 打开目标网站
driver.get('http://example.com')

# 添加Cookies到浏览器
for name, value in cookies.items():
    driver.add_cookie({
   
   'name': name, 'value': value})

# 刷新页面以应用Cookies
driver.refresh()

# 执行抓取操作
content = driver.page_source
print(content)

# 关闭浏览器
driver.quit()

结论

通过本文的介绍,您应该能够解决ChromeDriver 125无法找到chromedriver.exe的问题,并顺利配置Selenium进行数据抓取。示例代码展示了如何使用代理IP、设置User-Agent和Cookie,提升爬虫的隐蔽性和成功率。希望这些技巧能为您的数据抓取项目提供帮助。

相关文章
|
Web App开发 Python
【Chromedriver】下载、安装及配置
简介:【Chromedriver】下载、安装及配置
10961 60
【Chromedriver】下载、安装及配置
|
前端开发 Java 关系型数据库
记录:Failed to validate connection com.mysql.cj.jdbc.ConnectionImpl...解决方案【亲测有效】
记录:Failed to validate connection com.mysql.cj.jdbc.ConnectionImpl...解决方案【亲测有效】
6606 0
|
8月前
|
IDE 开发工具 开发者
手把手教你安装PyCharm 2025:开发者的Python IDE配置全流程+避坑指南
本教程详细介绍了PyCharm 2025版本在Windows系统下的安装流程及配置方法,涵盖AI代码补全与智能调试工具链等新功能。内容包括系统要求、安装步骤、首次运行配置(如主题选择与插件安装)、创建首个Python项目,以及常见问题解决方法。此外,还提供了切换中文界面和延伸学习资源的指导,帮助用户快速上手并高效使用PyCharm进行开发。
3953 61
|
存储 XML 人工智能
深度解读AI在数字档案馆中的创新应用:高效识别与智能档案管理
基于OCR技术的纸质档案电子化方案,通过先进的AI能力平台,实现手写、打印、复古文档等多格式高效识别与智能归档。该方案大幅提升了档案管理效率,确保数据安全与隐私,为档案馆提供全面、智能化的电子化管理解决方案。
1018 48
|
10月前
|
人工智能 测试技术
LIMO:上海交大推出高效推理方法,仅需817条训练样本就能激活大语言模型的复杂推理能力
LIMO 是由上海交通大学推出的一种高效推理方法,通过极少量的高质量训练样本激活大语言模型的复杂推理能力。
408 11
|
XML 关系型数据库 MySQL
【MySQL异常】ExecutorException: Error getting generated key or setting result to parameter object
【MySQL异常】ExecutorException: Error getting generated key or setting result to parameter object
896 0
|
Web App开发 数据采集 开发者
如何解决ChromeDriver 126找不到chromedriver.exe问题
当使用Selenium与ChromeDriver 126时,遇到`chromedriver.exe`找不到的错误,可能是因为版本不匹配、文件路径错误或系统设置不当。解决方法包括:匹配Chrome浏览器版本下载ChromeDriver,确保文件在正确路径且有执行权限,以及调整系统设置允许执行。示例代码展示了如何设置代理IP、user-agent和cookie来运行Selenium爬虫。通过这些步骤,可以确保爬虫程序顺利运行。
1094 2
如何解决ChromeDriver 126找不到chromedriver.exe问题
|
存储 算法 数据可视化
【Python】实现二维装箱Bottom-Left算法及用人工蜂群算法改进
本文介绍了二维装箱问题的Bottom-Left算法,并提供了Python实现,包括主函数、装箱顺序、重叠检测、最终位置计算等,同时指出了算法的缺点并提出了使用人工蜂群算法进行改进的方法,最后提供了完整代码的下载链接。
848 1
|
关系型数据库 MySQL Shell
Windows下的mysql字符集格式修改
在Windows上的MySQL 5.7.17,若安装时未设置字符集,可能导致乱码问题。本文提供了解决方案:首先,通过`mysql -uroot -p`登录并使用`show variables like '%char%';`查看当前字符集。然后,有两种修改方法:一是使用Shell命令临时修改9个相关属性为utf8;二是永久修改,在my.ini配置文件中将[mysqld]、[client]、[mysql]下的字符集改为utf8。记得重启MySQL服务以应用更改。此外,还提供了修改数据库和表字符集的SQL命令。
|
人工智能 自然语言处理 算法
魔塔社区体验AI开发
魔塔社区做AI开发的初体验
34318 0
魔塔社区体验AI开发