开发者社区> 老先生二号> 正文

搜索引擎汇总

简介:
+关注继续查看

Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...

Apache Solr
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。http://lucene.apache.org/solr/ 

Elastic Search
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。http://www.elasticsearch.com

Index Tank
IndexTank, 一套基于Java的索引-实时全文搜索引擎实现,Includes features like variables (boosts), categories (facets), faceted search, snippeting, custom scoring functions, suggest, and autocomplete。IndexTank的设计分离了相关性标记和文档内容,因为相关性标记的生命周期和文档本身是不一样的,特别是在用户创建的内 容的情况下,例如 分享次数,Like按钮,+1按钮等等。https://github.com/linkedin/indextank-engine

Katta

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。

Katta可用于大量、重复、索引的碎片,以满足高负荷和巨大的数据集。这些索引可以是不同的类型。当前该实现在LuceneHadoop mapfiles

 http://katta.sourceforge.net/ 

Bobo Search 

bobo-browse 是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。

比如说搜索电脑,可以得到cpu是intel的有几条命中记录,cpu是amd的有几条命中记录。

 https://github.com/javasoze/bobo 

Compass

Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架.Compass包括:  

* 搜索引擎抽象层(使用Lucene搜索引荐),
 * OSEM (Object/Search Engine Mapping) 支持,
 * 事务管理,
 * 类似于Google的简单关键字查询语言, 
 * 可扩展与模块化的框架,
 * 简单的API.

 http://www.compass-project.org/ 

Summa

Summa是一种由java开发的,快速模块化和可扩展的搜索引擎. Summa 有如下特点:

  • 综合搜索. Summa 能够同时访问许多不同的数据和资料来源,并以一个统一的接口公开

  • 模块化设计.Summa 搜索系统由一系列独立模块组成, 这样使得它更简单容易地被维护和升级

  • 可扩展性. Summa 支持分布式架构而且能够按比例的扩大或缩小以处理任何数量的数据

  • 开放标准. Summa 基于现代web技术与标准, 不包含任何私有代码或原理.

  • 故障容错. 如果某单一数据资源或服务出错, Summa 将会继续运行而不受出错部分限制.

http://wiki.statsbiblioteket.dk/summa/ 

Constellio
Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 Web 的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。http://constellio.com/


本文转自快乐就好博客园博客,原文链接:http://www.cnblogs.com/happyday56/p/4240919.html,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
基于JStarCraft实现的搜索引擎
基于JStarCraft实现的搜索引擎
11 0
你真的会用搜索引擎吗?
Hello, 大家好,我是Jackpop。今天来跟大家聊一个我们每天都会用到的工具:搜索引擎。 互联网时代,搜索引擎已经成为一个无法绕开的工具,无论是电脑上,还是手机上,每天都会通过谷歌、百度搜索大量我们想要的答案。
60 0
零基础打造一款属于自己的网页搜索引擎
零基础打造一款属于自己的网页搜索引擎
121 0
SEO之了解搜索引擎
SEO之了解搜索引擎
60 0
了解搜索引擎的分词技术,更好的写好网站SEO标题
今天主要以百度的中文分词技术来讲解。通过对搜索引擎分词技术的了解,可以让大家做SEO的时候更合理的去书写SEO优化中的重点,三个标签的确定。 分词技术是中文搜索引擎特有的技术支持。中文信息和英文信息的差别在于;英文单词之间用的是空格分隔的,这对中文就行不通了,搜索引擎必须将整个句子切割成小单元词,如“我的兄弟姐妹”拆分出来的形态是我、的、兄弟、姐妹。分词技术的效率直接影响到整个系统的效率。
145 0
怎么让搜索引擎收录网站?
网站收录是每个SEOer都要解决的问题,尤其是新站百度,非常慢,要从网站的标题、内容、访问速度、建档等方面进行调整。今天网站地图SEO详细讲讲如何让网站收录。有哪些方法可以有效地让网页被搜索引擎收录?
128 0
怎么快速的让网站被收录?搜索引擎的工作原理
要想在搜索引擎中有好的排名表现,网站收录是基础。另一方面,页面收录的数量级也代表了网站的整体质量。在我看来,要想收录百度网站,首先要了解搜索引擎的工作原理,这样才能迎合搜索规则,让网站收录达到理想状态。
248 0
2019年最新出搜索引擎蜘蛛网页爬虫大全
2019年最新出搜索引擎蜘蛛网页爬虫大全分享,各大seo引擎搜索的蜘蛛会一次又一次访问爬取我们站点的文章内容,也会耗费一定的站点流量; 有时候就必须屏蔽一些蜘蛛浏览我们的站点,文章尾部会讲解决方案; 掌握各大搜索引擎蜘蛛爬虫,对我们开展网站SEO优化具有挺大作用;作者搜集了各大搜索引擎的蜘蛛爬虫UA,便于你需要时查看。
3727 0
浅析:搜索引擎如何排名一个页面?
我们每天都在思考,如何将自己的关键词排名提升到百度首页,但我们几乎从来没有静下来思考,搜索引擎是如何排名一个页面? 这就是为什么,有的SEO人员,看到明明是“SEO垃圾页面”: ①标题冗长,堆积关键词。
1217 0
文章
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载