使用Solr构建企业级的全文检索(二)---------管理界面简介

简介:

 昨天这个系列开篇了,今天就趁热打铁吧。有一点要注意的是,一开始我是在64位的Windows 7上的Tomcat中部署Solr的,在使用过程中发现非常的不稳定,经常添加两个文档或者是查询一两次后,tomcat就崩溃了,让我对Solr的稳定性很是担忧,又来部署到虚拟机中的CentOS上,非常的稳定又高效。在Windows 7上为什么不稳定,我没有去分析,可能是因为各个组件的版本间的问题吧。如果哪位同学希望在Tomcat中部署Solr,请参考《Solr with Apache Tomcat》或者《在tomcat上部署solr 》。如果使用Tomcat,一定不要忘记在server.xml文件中connector节点中添加URIEncoding="UTF-8",否则你在做中文检索的时候就会出问题。

     现在环境已经搭建了好,我们通过http://localhost:8983/slor/admin地址来访问Solr的管理页面,如下:

      简要的介绍一下这个管理界面吧,首先是Schema,点击这个链接可以看到Solr的conf目录下的schema.xml文件的内容,从这里看到的内容和从Schema Browser链接里看到的内容是一致的,只是形式不同,SCHEMA BROWSER看到的更友好一些,儿SCHEMA里看到的就是原本的schema.xml的文本。在这两个地方你都不能修改里面的内容。Schema文件定义了Solr里面存储的文档的字段类型以及字段,这个我们后边会详细讲。

    ANALYSIS这个链接是用来帮助你开发和调试的,如下图:

    

    在这里你可以很方便的测试你定义的字段类型以及字段是否正确,你指定字段,然后在Field Value(Index)中放入你期望分析的文档内容,在Field  Value(query)中放入你期望检索的词,点即Analyze按钮,下边就会出现文档是如何进行分词的,然后你检索的词命中的话就会高亮显示。这个工具对于我们进行字段定义,配置是很有用的。

    STATISTICS,顾名思义就是统计信息,在这里你可以看到在Solr里面索引了多少文档,各种Handler的处理情况,比如搜索处理器,每秒钟处理多少个响应,每个响应使用了多长时间,还有Cache的使用情况,比如林林种种的Cache是如何设置的,Cache的命中率如何,命中次数如何,自热的次数以及自热的用时等等,这些信息对日后的性能调校是又很大的用处的。

    INFO的用处不太大,从这里面你可以看到Solr内部的这个种Handler是如何配置的。

    Distribution 是用来查看Solr的分布式设置的,从这里你可以看到当前的Solr实例是Master Server还是Slave Server,系统是如何分布的。分布式正是Solr的强大之处,利用这些特性你可以很方便的Scale up或者Scale out你的系统。

    在LOGGING里,你可以设定哪些日志是需要输出的。

    最后介绍一下管理界面中的一个重要的组成部分,就是Make a Query,如果你仅仅只是想看看现在solr里面是否能检索到某个词,就可以直接在这里输入,然后查看结果,比如输入“text:lucene”,就是查询在text字段的内容中包含lucene这个单词的文档。这里能使用的功能十分有限,相当于仅仅只发送给Solr了q参数的内容。如果你想使用更复杂的查询,那么点击Make a Query 右边的FULL INTERFACE,会出现下边的界面:

     

     不要被这个FULL INTERFACE给忽悠了,以为这就是Solr全部的查询功能,其实,除了debug参数,这里面不过依次列出了q,fq,start,rows,fl,qt,hl,hl.fl参数,二实际上lucene/Solr提供的的查询参数是数倍于这些。所以这个应付简单的查询还可以,复杂的查询,可以通过查询结果的地址栏手动修改吧,如下图:

     好了,天色已晚,今天就写到这里吧,接下来讲解schema的定义






本文转自纶巾客博客园博客,原文链接:http://www.cnblogs.com/guanjinke/archive/2011/12/08/2281394.html,如需转载请自行联系原作者
目录
相关文章
|
消息中间件 存储 缓存
Spring Cloud 分布式实时日志分析采集三种方案~
Spring Cloud 分布式实时日志分析采集三种方案~
Spring Cloud 分布式实时日志分析采集三种方案~
|
自然语言处理 编译器 Linux
【Latex】texstudio使用和ACL论文模板初步解读
LaTeX是一类用于编辑和排版的软件,用于生成PDF文档。 LaTeX编辑和排版的核心思想在于,通过\section和\paragraph等语句,规定了每一句话在文章中所从属的层次,从而极大方便了对各个层次批量处理。 LaTeX在使用体验方
2496 0
【Latex】texstudio使用和ACL论文模板初步解读
|
SQL 域名解析 网络协议
|
机器学习/深度学习 存储 数据采集
二手车价格预测 | 构建AI模型并部署Web应用 ⛵
二手车交易越发繁荣的当下,如何科学定价时买卖&平台三方都关心的问题。本文结合汽车价格预测数据集,讲解『二手车价格预估模型』构建和部署的全过程:数据分析处理 & 特征工程、机器学习建模、Web应用开发等。【代码与数据集亲测可运行】
5721 3
二手车价格预测 | 构建AI模型并部署Web应用 ⛵
|
存储 Prometheus 运维
阿里云ES全观测引擎TimeStream时序增强功能重磅发布,助力时序场景实现最佳实践
阿里云ES全观测引擎TimeStream时序增强功能最新发布,在云原生ELK全托管基础上,通过TimeStream时序增强功能插件,可实现高性能、低成本时序数据存储和查询分析。本文介绍TimeStream适用场景、功能优势、性能测试结果和实践案例
2754 0
|
编解码 安全 数据安全/隐私保护
AirServer手机万能投屏器Win和Mac系统均可使用
手机投屏器是一款能够将手机内容投影到电脑上的软件,手机投屏器一经出现就受到广大用户的喜爱和好评。有了投屏软件,玩游戏或者看斗鱼虎牙直播视频,都能随时投屏到电视上。那么手机投屏器哪个好,手机投屏器使用方法是怎么样的?下文告诉你答案。
988 0
|
监控 Python
python脚本批量生成grafana中dashboard的panel
python脚本批量生成grafana中dashboard的panel
707 0
python脚本批量生成grafana中dashboard的panel
|
消息中间件 JSON 分布式计算
利用maxwell组件监听mysql之binlog日志进行实时同步数据
利用maxwell组件监听mysql之binlog日志进行实时同步数据
|
NoSQL 关系型数据库 数据库连接
FastAPI(29)- Dependencies 依赖注入的初步使用
FastAPI(29)- Dependencies 依赖注入的初步使用
703 0
FastAPI(29)- Dependencies 依赖注入的初步使用
|
Oracle Java 关系型数据库
JVM源码分析之Metaspace解密
JVM源码分析之Metaspace解密

热门文章

最新文章