nodejs上HTML分析利器node-jquery

简介:

      首先描述产生这篇随笔的场景:我需要获取项目在jenkins构建的最新Javascript Coverage显示在供管理层次查看的项目情况Report上,但是由于jenkins没有直接的API取得数据所需数据,所以我们只能从自建的容器发布Javascript Coverage数据API,供Report项目使用。

     由于采用简单的数据分析,只是Host一个简单的web Server,所以本人不喜欢Tomcat,IIS这类大型工具,显得有点杀鸡用牛刀,班门弄斧。我更喜欢node.js这类简易的web容器。所以项目采用node.js,并node.js天然的javascript与html操作的天然一体,借助DOM结构使得解析Html更容易,简洁。

      Node.js解析HTML DOM的当然是htmlpaser,jsdom。然而个人更喜欢jQuery的风格,与web jQuery的统一API,所以选择了node-jquery.其代码部署在Github的https://github.com/coolaj86/node-jquery.

     下面是本人写个一个简单demo:  抓取Github Popular project打印在控制台输出。

复制代码
 1 var $ = require('jquery');
 2 
 3  
 4 
 5 String.format = function() {
 6 
 7     var s = arguments[0];
 8 
 9     for (var i = 0; i < arguments.length - 1; i++) {
10 
11         var reg = new RegExp("\\{" + i + "\\}", "gm");
12 
13         s = s.replace(reg, arguments[i + 1]);
14 
15     }
16 
17  
18 
19     return s;
20 
21 };
22 
23  
24 
25  $.get("https://github.com/popular/forked",function(html){
26 
27  
28 
29         var $doc = $(html);
30 
31     console.log("No.  name  language  star   forks  ")
32 
33         $doc.find("ul.repolist li.source").each(function(i,project){
34 
35  
36 
37         var $project = $(project);
38 
39                var name = $project.find("h3").text().trim();
40 
41                var language = $project.find("li:eq(0)").text().trim();
42 
43                var star = $project.find("li.stargazers").text().trim();
44 
45                var forks = $project.find("li.forks").text().trim();
46 
47                var row =String.format("{4} {0}  {1}  {2}  {3}",name,
48 
49                        language,star,forks,i + 1 );
50 
51               
52 
53                console.log(row);
54 
55         });
56 
57  });
复制代码

此项目寄宿在我Github https://github.com/greengerong/node-jquery-demo。仅供了解node-jquery学习demo,欢迎指教。

 


作者:破  狼 
出处:http://www.cnblogs.com/whitewolf/ 
本文版权归作者,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。该文章也同时发布在我的独立博客中-个人独立博客博客园--破狼51CTO--破狼。http://www.cnblogs.com/whitewolf/archive/2013/02/27/2935618.html


相关文章
|
1月前
|
数据采集 存储 JavaScript
PHP爬虫技术:利用simple_html_dom库分析汽车之家电动车参数
本文旨在介绍如何利用PHP中的simple_html_dom库结合爬虫代理IP技术来高效采集和分析汽车之家网站的电动车参数。通过实际示例和详细说明,读者将了解如何实现数据分析和爬虫技术的结合应用,从而更好地理解和应用相关技术。
PHP爬虫技术:利用simple_html_dom库分析汽车之家电动车参数
|
前端开发 JavaScript 索引
重学前端 35 # HTML标准分析
重学前端 35 # HTML标准分析
99 0
|
移动开发 Java HTML5
HTML5 学习9.页面结构分析
HTML5 学习9.页面结构分析
|
前端开发 JavaScript Java
C,C++,python,Java,VB,HTML/CSS/JS语言的特点分析(四方面总结)(大学生)
C,C++,python,Java,VB,HTML/CSS/JS语言的特点分析(四方面总结)(大学生)
245 0
|
Web App开发 JavaScript
JS获取网页中HTML元素的几种方法分析
getElementById getElementsByName getElementsByTagName 大概介绍   getElementById ,getElementsByName ,getElementsByTagName ###adv###   后两个是得到集合,byid只是得到单...
1052 0
|
新零售 Web App开发 移动开发
Html5与本地App资料整理分析
最近开发了一个小的手机网站,重新了解了本地应用,html5,混合应用,webApp等概念,整理下相关的资料,略带自己的思考 用户固有的使用习惯 在《2012年度 HTML5状况及发展形势报告.pdf》中有这样的观点:文档可以评论本文索要。
1122 0
|
JavaScript 前端开发 Go
在HTML中使用JavaScript(浏览器对js的加载机制分析)
前言:   向HTML页面中插入JavaScrip的主要方法,就是使用标签。主要探讨标签的在HTML页面的渲染机制。对应的业务场景:从js的加载机制,去优化首次加载页面白屏时间过长的问题   要点:   1.script标签用外链的src引入文件时,内嵌的js代码无效。
4445 0
|
Web App开发 XML JavaScript
|
Web App开发 JavaScript 前端开发