分别利用phantomjs和slimerjs实现网页的爬取和截图代码逻辑

简介: 文章介绍了如何使用PhantomJS和SlimerJS两种工具实现网页的爬取和截图,提供了具体的代码示例和执行命令。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

phantomjs实现

具体步骤如下

1. 下载对应系统版本的phantomjs到本地,例如我的phantomjs-2.1.1-macosx

2.编写爬取逻辑代码phantomjs.js:

var page = require('webpage').create();

page.settings.userAgent = 'SpecialAgent';
page.settings.javascriptEnabled = true;

phantom.cutputEncoding = 'gbk';
page.open("https://www.jianshu.com", function(status) {
  if(status === "success") {
    console.log("Page success");
    page.render("jianshu.png");
  } else {
    console.log("Page failed to load.");
  };
phantom.exit();
});

3,执行

/Users/***/Desktop/phantomjs-2.1.1-macosx/bin/phantomjs phantomjs.js

slimerjs实现

具体步骤如下

1. 安装步骤命令:

npm install slimerjs
npm install node-slimerjs\n
./node_modules/.bin/slimerjs -v

2.编写爬取逻辑代码slimerjs.js:

var webpage = require('webpage').create();

webpage
    .open('https://davidwalsh.name')
    .then(function(){
   
      webpage.viewportSize = {
    width: 1042, height: 2048 };
      webpage.render('dwb.png', {
    onlyViewport: true });
      slimer.exit()
    });

3. 执行命令

./node_modules/.bin/slimerjs src/slimerjs.js
相关文章
|
4月前
|
数据采集 Web App开发 JSON
浏览器插件:WebScraper基本用法和抓取页面内容(不会编程也能爬取数据)
本文以百度为实战案例演示使用WebScraper插件抓取页面内容保存到文件中。以及WebScraper用法【2月更文挑战第1天】
366 2
浏览器插件:WebScraper基本用法和抓取页面内容(不会编程也能爬取数据)
|
4月前
|
数据采集 Java 数据挖掘
如何使用ScrapySharp下载网页内容
如何使用ScrapySharp下载网页内容
|
5天前
|
数据采集 JSON JavaScript
如何通过 PhantomJS 模拟用户行为抓取动态网页内容
随着网页技术的进步,JavaScript 动态加载内容已成为新常态,对传统静态网页抓取提出挑战。PhantomJS 作为无头浏览器,能模拟用户行为并执行 JavaScript,成为获取动态网页内容的有效工具。本文介绍如何使用 PhantomJS 结合爬虫代理 IP 技术,抓取大众点评上的商家信息,包括店名、地址和评分等关键数据,从而更高效地获取动态网页内容,支持数据收集与分析。
如何通过 PhantomJS 模拟用户行为抓取动态网页内容
|
前端开发
前端常规关于网页文件下载的问题
前端常规关于网页文件下载的问题
54 0
|
4月前
|
Web App开发 数据采集 数据挖掘
还有这种骚操作:使用Golang实现无头浏览器浏览和截图
还有这种骚操作:使用Golang实现无头浏览器浏览和截图
300 0
|
数据采集 JavaScript 前端开发
Selenium+代理爬取需要模拟用户交互的网站
Selenium+代理爬取需要模拟用户交互的网站
|
数据采集 Web App开发 存储
使用 Scrapy + Selenium 爬取动态渲染的页面
使用 Scrapy + Selenium 爬取动态渲染的页面
466 0
使用 Scrapy + Selenium 爬取动态渲染的页面
|
Web App开发 JavaScript 开发者
【软件技巧】【截图】浏览器自带的全网页截图工具
【软件技巧】【截图】浏览器自带的全网页截图工具
339 0
【软件技巧】【截图】浏览器自带的全网页截图工具
|
数据采集 缓存 编解码
|
数据采集 编解码 移动开发
Puppeteer + Nodejs 通用全屏网页截图方案(二)常用参数实现
学习如何对网页截图程序设计基本参数功能。