开发者学堂课程【Lucene 知识精讲与实战(上): 搜索流程详细分析】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/700/detail/12329
搜索流程详细分析
内容介绍
一、搜索界面展示
二、搜索过程原理
一、搜索界面展示
一般会在搜索页面的输入关键字的词条输入用户要搜索的关键字,点击搜索,就会显示搜索结果。
二、搜索过程原理
内部的结构原理是关键字有可能是一个字一个词一句话,如果是一句话或者是多个词的话会对这句话和多个词进行切分词,之后会对切分之后的词一个个进行搜索,如果输入的是“华为手机”,就会被切分为“华为”、“手机”,会搜索出包含关键字“华为”和“手机”的文档,如果“华为”、“手机”之间的关系是并且(相交)的关系,那么搜索出来的文档既要包含“华为”,也要包含“手机”。
原理如下图:
词之间的关系是交集还是并集,要看自己写的代码,根据自己的需要来写,不管是交集还是并集,都是要去掉重复的词。索引的过程和搜索的过程都用代码。
下面就是查询 Lucene 的结果,不仅有百度百科还有官网等等信息: