Solr&Lucene4.0 序列文章(1)-主题汇总

简介: 假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。

Solr&Lucene4.0 序列文章-1
-1
主要是汇总主题,后续将陆续将相关信息分享出来。
lucene1.2 lucene2.0lucene2.4 lucene2.9lucene3.4 一路走过来,lucene的变化和继承发展,
见证对搜索的接触、学习、学习的点滴。SolrLucene将在java 搜索、信息检索扮演更加巨大的作用。
如今每一个使用eclipse的人,不知不觉就在使用lucene的东西了。每一个twitter 都在使用lucene提供的服务,每一个购物者在阿里平台上都有lucene的痕迹。。。。。。

1 Performance optimization with Lucene4.0
系统介绍lucene4.0 性能和改进的亮点

2 Apache Lucene 4
sigir2012 paper
,毫无疑问这篇paper的含金量超过之前的所有文档。

3 New Lucene 4 Functions Improve Enterprise Search Indexing
针对于function的性能改进,将丰富和提升lucene的复杂查询的分量

4.Lucene's FuzzyQuery is 100 times faster in 4.0
模糊查询一直以来是个好性能的功能,4.0做了什么样的改进才100倍提升呢。

5.Solr Result Grouping/Filed Collapsing Improvements
越来越多的应用依赖group facet,性能瓶颈依然存在,但是新版4.0 表现更强劲的性能

6.Lucene4.0 Score model
IR
的核心得分,过去的强制VSM,到如今按需选择,将排序质量交由用户自己来负责。
扩展性、可用性、深入并且简单的插入到lucene core内部,又不受整个lucene的牵制

7.Near Real Time Search ver 4.X
你相信吗,每秒写入7w的文档在实时模式下。这是真的吗?

8.Solr&Lucene4.0 Important DataStructure share
所有新的特性,究竟有哪些数据结构、哪些设计模式、哪些算法、哪些牛人
将带你一起回顾,揭开神秘的lucene4.0 背后蕴藏了哪些 共性、普遍性、高性能、好工程、牛人。

 

目录
相关文章
|
存储 自然语言处理 索引
Lucene&&Solr中的域(Filed)总结
Lucene&&Solr中的域(Filed)总结
82 0
Lucene&&Solr中的域(Filed)总结
|
存储 搜索推荐 Java
全文搜索引擎 Lucene Solr ElasticSearch 关系?
全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。
全文搜索引擎 Lucene Solr ElasticSearch 关系?
|
存储 SQL 编解码
Solr-lucene 使用案例大全
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。 本文sole lucene的使用案例汇总。
192 0
|
存储 自然语言处理 分布式计算
Solr\Lucene优劣势分析
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。
263 0
|
算法 Java Maven
Lucene&solr 4 实践(4)
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。本部分主要分析FST,快乐理解lucene fst包的源码细节和来龙去脉。
120 0
|
编解码 缓存 自然语言处理
Lucene&Solr 4 实践(2)
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。在第一部分,还不完善基础上,进入第二部分吧。结合源码来认识lucene! 重点是:从需求到方案到实践编码到结果、从原理到实现、从结构到细节、从总体认识到西部深入。
82 0
|
自然语言处理 Java API
Lucene&solr 4 实践(1)
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。Solr&Lucene 4.0 好,很好,很强大。对于从lucene2.0 solr0.9 就关注,一直过来的人来讲, 4.X序列除了的架构、风格、API改变了很多很多,更重要的是业务的优化口子更多了,专业知识要求更高。整个架子的容量、包容性、以及适应信息检索的科研,直接上来demo运行easy、深入会很难。需要整理了解的知识点太多了。
78 0
|
自然语言处理 算法 架构师
Lucene&solr 4 实践(8)
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。Lucene 5 有哪些点对大数据倒排索引和检索有优势 1.索引懒加载lazy加载,意味着按时间段或者其他分割的数据可以按需加载 2.FST词典结构以及基于图的索引、查询,使得内存消耗更低 3.异步合并,使得增量索引合并时的“索引整理”开销或者对查询影响更小 4.commitpoint 视图下reader自动更新,使得大规模数据的虚拟分组、全量切换更加方便。
117 0
|
自然语言处理 索引
Lucene&solr 4 实践(3)
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。本部分主要是针对FSA FST做前期知识储备和基本概念扫盲。FST是lucene4 solr4 的索引和查询的核心! 下面的内容来自多个出去,出去就不一一列举。
89 0
Lucene&solr 4 实践(3)
|
自然语言处理 算法 Apache
Lucene&solr 4 实践(5)
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。这部分先通透FST的原理和构造方法,方便理解lucene FST、Builder两个核心对象,从而彻底看清基于图的lucene4索引、查询的发展脉络。至于读懂后有神马用,自个琢磨啊! 看懂估计要死伤不少脑细胞哦!
197 0