开发者社区开发与运维文章正文

python3使用selenium并加代理访问网页

2022-12-11 472

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： python3使用selenium并加代理访问网页

用selenium打开浏览器，会遇到一个问题，打开太多容易被封IP。那么需要一些代理来间接地取得网页内容。

python里面就是有这个好处，API提供这个选项。注意server后面直接跟随代理和端口：

firefox_options.add_argument("--proxy-server=http://122.141.74.186:8080")

from selenium import webdriver
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
import sys
firefox_options = webdriver.FirefoxOptions()
firefox_options.add_argument("--proxy-server=http://122.141.74.186:8080")
binary = FirefoxBinary('C:\\Program Files\\Firefox51\\firefox.exe', log_file=sys.stdout)
driver = webdriver.Firefox(firefox_binary=binary, firefox_options=firefox_options)

最近xici代理居然打不开了——2020年12月

文章标签：

Python

API

关键词：

Python网页

Python访问

Python Selenium

Python代理

Selenium网页

erabbit

凉凉心.

8月前

Java 数据处理索引

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

DataFrame结构每一列都属于Series类型，不同列之间数据类型可以不一样，但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列，该列记录了每一行的索引在DataFrame中，若列之间的元素个数不匹配，且使用Series填充时，在DataFrame里空值会显示为NaN；当列之间元素个数不匹配，并且不使用Series填充，会报错。在指定了index 属性显示情况下，会按照index的位置进行排序，默认是 [0,1,2,3,...] 从0索引开始正序排序行。

凉凉心.

627 0 1

小白学大数据

11月前

Web App开发存储前端开发

Python+Selenium自动化爬取携程动态加载游记

小白学大数据

666 0 0

顾翔

9月前

SQL 测试技术数据库

healenium+python+selenium

上次介绍了如何利用healenium+java+selenium来实现selenium的自愈，这次介绍如何healenium+python+selenium。关于healenium+python+selenium网上资料更少，并且甚至是错误的。在著名的书籍《软件测试权威指南中》也是有一定问题的。现在介绍如下

顾翔

476 4 4

小白学大数据

Web App开发数据采集 JavaScript

动态网页爬取：Python如何获取JS加载的数据？

小白学大数据

1862 58 58

小白学大数据

11月前

数据采集存储 NoSQL

Python爬虫案例：Scrapy+XPath解析当当网网页结构

小白学大数据

534 0 0

小白学大数据

数据采集存储前端开发

Python爬虫自动化：批量抓取网页中的A链接

小白学大数据

667 4 5

小白学大数据

11月前

数据采集 Web App开发 iOS开发

解决Python爬虫访问HTTPS资源时Cookie超时问题

小白学大数据

685 0 0

小白学大数据

数据采集 Web App开发 JavaScript

Python爬虫解析动态网页：从渲染到数据提取

小白学大数据

1001 0 1

站大爷

11月前

数据采集机器学习/深度学习边缘计算

Python爬虫动态IP代理报错全解析：从问题定位到实战优化

本文详解爬虫代理设置常见报错场景及解决方案，涵盖IP失效、403封禁、性能瓶颈等问题，提供动态IP代理的12种核心处理方案及完整代码实现，助力提升爬虫系统稳定性。

站大爷

599 0 0

小白学大数据

数据采集 Web App开发前端开发

Python+Selenium爬虫：豆瓣登录反反爬策略解析

小白学大数据

792 6 8

python3使用selenium并加代理访问网页

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

python3使用selenium并加代理访问网页

热门文章

最新文章

相关课程

相关电子书

推荐镜像