利用nodejs的cheerio抓取网站数据

简介: /*引入模块*/var http = require('http')var url = 'http://www.cnblogs.com/txxt'var cheerio = require('cheerio')/*过滤函数*/function filter(html) { var $ = cheerio.
/*引入模块*/
var http = require('http')
var url = 'http://www.cnblogs.com/txxt'
var cheerio = require('cheerio')

/*过滤函数*/
function filter(html) {
   var $ = cheerio.load(html)
   var titleData = [];
   var title = $('.postTitle').text();
   console.log(title)
}

/*数据获取*/
http.get(url, function(res){
	var html = '';
	res.on('data',function(data) {
		html += data;
	})
	res.on('end',function(){
		filter(html)
	})
}).on('error',function(){
	console.log('获取数据出错')
})

  

相关文章
|
数据采集 存储 JSON
利用Node.js实现拉勾网数据爬取
利用Node.js实现拉勾网案数据爬取
|
10月前
|
数据采集 存储 JavaScript
如何使用Puppeteer和Node.js爬取大学招生数据:入门指南
本文介绍了如何使用Puppeteer和Node.js爬取大学招生数据,并通过代理IP提升爬取的稳定性和效率。Puppeteer作为一个强大的Node.js库,能够模拟真实浏览器访问,支持JavaScript渲染,适合复杂的爬取任务。文章详细讲解了安装Puppeteer、配置代理IP、实现爬虫代码的步骤,并提供了代码示例。此外,还给出了注意事项和优化建议,帮助读者高效地抓取和分析招生数据。
414 0
如何使用Puppeteer和Node.js爬取大学招生数据:入门指南
|
存储 缓存 监控
|
Web App开发 JavaScript 前端开发
一文搞懂:使用nodejs爬取和讯网高管增减持数据
一文搞懂:使用nodejs爬取和讯网高管增减持数据
242 0
|
数据采集 存储 JavaScript
深入Node.js:实现网易云音乐数据自动化抓取
深入Node.js:实现网易云音乐数据自动化抓取
LabVIEW使用VI服务器的调用节点将数据传递到另一个VI 使用调用节点(Invoke Node)与通过引用调用节点(Call by Reference)调用VI时有什么差别?
LabVIEW使用VI服务器的调用节点将数据传递到另一个VI 使用调用节点(Invoke Node)与通过引用调用节点(Call by Reference)调用VI时有什么差别?
444 0
|
SQL JavaScript 前端开发
【nodejs进阶之旅(2)】:使用koa2+mysql 实现列表数据分页
【nodejs进阶之旅(2)】:使用koa2+mysql 实现列表数据分页
263 0
|
JavaScript 关系型数据库 MySQL
如何去掉 node.js 获取MySQL数据产生的RowDataPacket
如何去掉 node.js 获取MySQL数据产生的RowDataPacket
【Node】—接收参数 插入数据 实现注册功能
【Node】—接收参数 插入数据 实现注册功能
|
JavaScript NoSQL 关系型数据库
从Node.js中提取数据
从Node.js中提取数据
207 1