JSpider(2):JSpider是什么?

简介:
从名字可以看出,JSpider是一个用Java实现的Web Spider。JSpider官方网站这样说的:

None.gif JSpider is: 
None.gif•    A highly configurable and customizable Web Spider engine. 
None.gif•    Developed under the LGPL Open Source license 
None.gif•    In 
100 % pure Java 
None.gifYou can use it to : 
None.gif•    Check your site for errors (internal server errors
,  dot.gif
None.gif•    Outgoing and/or internal link checking 
None.gif•    Analyze your site structure (creating a sitemap
,  dot.gif
None.gif•    Download complete web sites 
None.gif•    Any task you want
,  if you write a JSpider plugin. 
None.gif

JSpider的执行格式如下:

jspider [URL] [ConfigName]

URL一定要加上协议名称,如:http://,否则会报错。如果省掉ConfigName,则采用默认配置。

JSpider的行为是由配置文件具体配置的,比如采用什么插件,结果存储方式等等都在conf\[ConfigName]\目录下设置。JSpider默认的配置种类很少,用途也不大。但是JSpider非常容易扩展,可以利用它开发强大的网页抓取与数据分析工具。要做到这些,需要对JSpider的原理有深入的了解,然后根据自己的需求开发插件,撰写配置文件。

本文转自xiaotie博客园博客,原文链接http://www.cnblogs.com/xiaotie/archive/2005/10/07/249761.html如需转载请自行联系原作者


xiaotie 集异璧实验室(GEBLAB)

相关文章
|
6月前
|
开发框架 Java .NET
PHP语言
PHP语言
77 2
|
5月前
|
存储 NoSQL 数据库连接
redis主从复制
redis主从复制
49 0
|
11月前
|
数据可视化
「战略设计」利用各种战略分析工具
「战略设计」利用各种战略分析工具
|
机器学习/深度学习 搜索推荐 算法
算法设计与分析 实验一 排序算法性能分析(上)
算法设计与分析 实验一 排序算法性能分析(上)
308 0
算法设计与分析 实验一 排序算法性能分析(上)
|
运维 JavaScript 前端开发
前端Vue项目打包部署实战教程
前言 在前后端还没有分离的时代下,前端项目通常时放在后端项目的静态资源目录下一起部署的,那个时候并没有专门的前端程序员,或者也可以说前端程序员不需要自己部署网站。通常前端人员只需要把网站源文件如.html文件结尾的资源包发给后端或者运维即可,剩下的事便交给后端或运维搞定了。 但是前后端分离开发后,前后端项目也通常分离部署了,这个时候可能就需要前端人员自己部署前端项目,然后前端人员可能很少接触到服务器等知识,所以部署网站时总是捉襟见肘。 这边文章主要就是讲解如何将一个前端项目部署到服务器,并且外网可以访问,前端项目就以Vue项目为例。
1710 0
前端Vue项目打包部署实战教程
|
存储 数据采集 人工智能
搜索引擎背后的经典数据结构和算法
本文主要为大家介绍搜索引擎,会深度剖析搜索引擎的工作原理及其中用到的一些经典数据结构和算法,相信大家看了肯定有收获。
5701 0
搜索引擎背后的经典数据结构和算法
|
8天前
|
人工智能 自然语言处理 API
深入浅出LangChain与智能Agent:构建下一代AI助手
LangChain为大型语言模型提供了一种全新的搭建和集成方式,通过这个强大的框架,我们可以将复杂的技术任务简化,让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。
279541 52
深入浅出LangChain与智能Agent:构建下一代AI助手
|
9天前
|
设计模式 人工智能 JSON
一文掌握大模型提示词技巧:从战略到战术
本文将用通俗易懂的语言,带你从战略(宏观)和战术(微观)两个层次掌握大模型提示词的常见技巧,真正做到理论和实践相结合,占领 AI 运用的先机。
237784 4
|
9天前
|
NoSQL Cloud Native Redis
Redis核心开发者的新征程:阿里云与Valkey社区的技术融合与创新
阿里云瑶池数据库团队后续将持续参与Valkey社区,如过往在Redis社区一样耕耘,为开源社区作出持续贡献。
Redis核心开发者的新征程:阿里云与Valkey社区的技术融合与创新
|
9天前
|
关系型数据库 分布式数据库 数据库
PolarDB闪电助攻,《香肠派对》百亿好友关系实现毫秒级查询
PolarDB分布式版助力《香肠派对》实现百亿好友关系20万QPS的毫秒级查询。
PolarDB闪电助攻,《香肠派对》百亿好友关系实现毫秒级查询