文档备案控制台

开发者社区开发与运维文章正文

python phantomjs+ selenium2 抓取动态js网页(版本python2.7+)

2016-05-19 1973

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 1、下载phantomjs linux版本解压即可单独使用方法：../bin/phantomjs create_img.js xxx.com(可选) 示例，抓取网页截图：建立一个pageload.js文件编写以下js var page = require('webpage').create();page.open('http://

1、下载phantomjs linux版本

解压即可

单独使用方法：../bin/phantomjs create_img.js xxx.com(可选)

示例，抓取网页截图：

建立一个pageload.js文件

编写以下js

var page = require('webpage').create();
page.open('http://cuiqingcai.com', function (status) {
    console.log("Status: " + status);
    if (status === "success") {
        page.render('example.png');
    }
    phantom.exit();
});

运行

phantomjs pageload.js

会在当前目录下看到截图

2、pip安装selenium

pip install selenium

3、selenium+phantomjs 结合写python文件

#!/usr/bin/python
#encoding:utf-8

from selenium import webdriver
#写phantomjs执行文件地址
driver = webdriver.PhantomJS(executable_path='/usr/local/soft_download/python_file/phantomjs/bin/phantomjs')
driver.get("http://mofangdata.cn/")
#driver.find_element_by_id('search_form_input_homepage').send_keys("Nirvana")
#driver.find_element_by_id("search_button_homepage").click()
print driver.current_url
driver.quit()

注意给python 执行权限 chmod u+x 文件名
运行 ./xx.py

文章标签：

Python

JavaScript

Linux

关键词：

Python网页

Python js

Python Selenium

Python抓取

JavaScript网页

lhyxcxy

目录

相关文章

游客rci3gd3n2dlu2

|

人工智能数据安全/隐私保护 Python

小红书图文生成器，小红书AI图文生成工具，python版本软件

Pillow库自动生成符合平台尺寸要求的配图7；3)利用Playwright实现自动化发布流程6。

游客rci3gd3n2dlu2

652 0 0

程序元宝

|

Ubuntu 安全 API

Python3.14正式支持Free Threaded版本！

Python 社区迎来历史性时刻！Python 3.14 正式将无 GIL 构建列为受支持选项，标志着 Free‑Threaded Phase II 启动。本文将深入解析 PEP 779 规定的支持标准、3.14.0b3 版本的新变化，以及这对Python开发者意味着什么。文末还有小彩蛋哦！

程序元宝

1996 87 87

小白学大数据

|

数据采集 Web App开发 JavaScript

基于Selenium的Python爬虫抓取动态App图片

基于Selenium的Python爬虫抓取动态App图片

小白学大数据

1126 68 69

小白学大数据

|

Web App开发数据采集 JavaScript

动态网页爬取：Python如何获取JS加载的数据？

动态网页爬取：Python如何获取JS加载的数据？

小白学大数据

1904 58 58

delacroix_xu-15509

|

10月前

|

JavaScript 前端开发安全

【逆向】Python 调用 JS 代码实战：使用 pyexecjs 与 Node.js 无缝衔接

本文介绍了如何使用 Python 的轻量级库 `pyexecjs` 调用 JavaScript 代码，并结合 Node.js 实现完整的执行流程。内容涵盖环境搭建、基本使用、常见问题解决方案及爬虫逆向分析中的实战技巧，帮助开发者在 Python 中高效处理 JS 逻辑。

delacroix_xu-15509

1834 0 0

游客rci3gd3n2dlu2

|

API 数据安全/隐私保护开发者

企业微信自动加好友软件，导入手机号批量添加微信好友，python版本源码分享

代码展示了企业微信官方API的合规使用方式，包括获取access_token、查询部门列表和创建用户等功能

游客rci3gd3n2dlu2

797 6 6

小白学大数据

|

数据采集存储 NoSQL

Python爬虫案例：Scrapy+XPath解析当当网网页结构

Python爬虫案例：Scrapy+XPath解析当当网网页结构

小白学大数据

578 0 0

小白学大数据

|

数据采集存储前端开发

Python爬虫自动化：批量抓取网页中的A链接

Python爬虫自动化：批量抓取网页中的A链接

小白学大数据

732 4 5

小白学大数据

|

数据采集 Web App开发 JavaScript

Python爬虫解析动态网页：从渲染到数据提取

Python爬虫解析动态网页：从渲染到数据提取

小白学大数据

1048 0 1

小白学大数据

|

数据采集 Web App开发 JavaScript

Python爬虫如何获取JavaScript动态渲染后的网页内容？

Python爬虫如何获取JavaScript动态渲染后的网页内容？

小白学大数据

1608 6 8

热门文章

最新文章

python绘图——绘制正负区分的柱形图[ax.bar()]

用Python做一个电影订票系统

Python的WeRoBot框架开发公众号

python __name__使用.

下载python所有的包国内地址

使用Python的pandas和matplotlib库绘制移动平均线（MA）示例

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

Python GUI编程：PySide2介绍

python: not found 问题的解决

折线图应用场景 | Python 数据可视化库 Matplotlib 快速入门之十二

Selenium爬虫部署七大常见错误及修复方案：从踩坑到避坑的实战指南

selenium的封装技术

介绍一款更好用的selenium自愈工具ReCheck

构建企业级Selenium爬虫：基于隧道代理的IP管理架构

Python+Selenium自动化爬取携程动态加载游记

基于Selenium的Python爬虫抓取动态App图片

Python+Selenium爬虫：豆瓣登录反反爬策略解析

Scrapy结合Selenium实现搜索点击爬虫的最佳实践

动态内容加载的解决方案：Selenium与Playwright对比故障排查实录

使用Selenium和ChromeDriver模拟用户操作：从表单填写到数据提交

相关课程

更多

Python语言基础 - 列表、元组、字典、集合

JavaScript入门与实战

Python Web开发基础

Python爬虫实战

Python开发基础入门

JavaScript 自学手册文档教程

相关电子书

更多

JavaScript函数

Delivering Javascript to World

编程语言如何演化-以JS的private为例

推荐镜像

更多

python-release

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！