用selenium打开浏览器,会遇到一个问题,打开太多容易被封IP。那么需要一些代理来间接地取得网页内容。
python里面就是有这个好处,API提供这个选项。注意server后面直接跟随代理和端口:
firefox_options.add_argument("--proxy-server=http://122.141.74.186:8080")
from selenium import webdriver from selenium.webdriver.firefox.firefox_binary import FirefoxBinary import sys firefox_options = webdriver.FirefoxOptions() firefox_options.add_argument("--proxy-server=http://122.141.74.186:8080") binary = FirefoxBinary('C:\\Program Files\\Firefox51\\firefox.exe', log_file=sys.stdout) driver = webdriver.Firefox(firefox_binary=binary, firefox_options=firefox_options)
最近xici代理居然打不开了——2020年12月