solr课程学习系列-solr的概念与结构(1)

简介: Solr是基于Lucene的采用Java5开发的一个高性能全文搜索服务器。源于lucene,却更比Lucene更为丰富更为强大的查询语言。同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。

Solr是基于Lucene的采用Java5开发的一个高性能全文搜索服务器。源于lucene,却更比Lucene更为丰富更为强大的查询语言。同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。

对于初学者可能对其不是很了解,下面将详细的介绍其结构。

先看下一本书的结构图

solr就好似一本书,索引结构如下图


solr创建索引的过程如下:
(1)、建立索引器IndexWriter,这相当于一本书的框架
(2)、建立文档对象Document,这相当于一篇文章
(3)、建立信息字段对象Field,这相当于一篇文章中的不同信息(标题、正文等)。
(4)、将Field添加到Document里面。
(5)、将Document添加到IndexWriter里面。
(6)、关闭索引器IndexWriter。

按照上图所示的结构,创建索引有三个基本的步骤:
(1)、创建Field,将文章的不同信息包装起来
(2)、将多个Field组织到一个Document里面,这样完成了对一篇文章的包装。
(3)、将多个Document组织到一个IndexWriter里面,也就是将多个文章组装起来,最终形成索引

从数据表的角度讲,solr其实就是一张表,如果你要建立多个表这就涉及到solr的多core知识。多core的创建将在下面的系列讲解,敬请大家关注。

 

来源 http://www.nice98.com/1.html

分类:  java

本文转自快乐就好博客园博客,原文链接:本文转自快乐就好博客园博客,原文链接:http://www.cnblogs.com/happyday56/p/5933552.html,如需转载请自行联系原作者如需转载请自行联系原作者
相关文章
|
11月前
|
XML JSON 搜索推荐
12Solr简介
12Solr简介
39 0
|
存储 自然语言处理 搜索推荐
ElasticSearch的基本介绍与用途、ElasticSearch中一些基本的概念、倒排索引的基本概念
ElasticSearch的基本介绍与用途、ElasticSearch中一些基本的概念、倒排索引的基本概念
113 1
|
存储 自然语言处理 搜索推荐
Elasticsearch 学习笔记(一)-----Lucene的简介以及索引原理
今天,正式开始学习Elasticsearch,因为Elasticsearch是用Lucene来实现索引的查询功能的,所以,理解Lucene的原理显的尤为重要。
515 0
Elasticsearch 学习笔记(一)-----Lucene的简介以及索引原理
|
XML 存储 JSON
Solr学习总结
Solr学习总结
142 0
Solr学习总结
|
SQL 存储 分布式计算
概述介绍-和 Hive 关系、异同 | 学习笔记
快速学习 概述介绍-和 Hive 关系、异同
177 0
概述介绍-和 Hive 关系、异同 | 学习笔记
|
存储 自然语言处理 分布式计算
全文检索工具solr:第一章:理论知识
全文检索工具solr:第一章:理论知识
119 0
|
存储 JSON API
【Elasticsearch 技术分享】—— ES 常用名词及结构
看完什么是 Elasticsearch 以及了解到了倒排索引的概念,下面就熟悉下 ES 中常用的一些名词。
229 0
【Elasticsearch 技术分享】—— ES 常用名词及结构
|
存储 人工智能 自然语言处理
看Lucene源码必须知道的基本概念
下面的一些基本概念不但有助于看源码,在使用像solr这样的搜索引擎框架的时候还可以知道自己的配置都做了些什么事情。我在定义这些概念的时候也都有自己的理解和思考。
看Lucene源码必须知道的基本概念
|
存储 分布式数据库 Hbase
带你读《HBase原理与实践》之二:基础数据结构与算法
Apache HBase是基于Apache Hadoop构建的一个高可用、高性能、多版本的分布式NoSQL数据库,是Google BigTable的开源实现,通过在廉价服务器上搭建大规模结构化存储集群,提供海量数据高性能的随机读写能力。
|
存储 分布式计算 分布式数据库
案例篇-HBase 基本知识介绍及典型案例分析
吴阳平 阿里巴巴 HBase 业务架构师
22215 0