什么是倒排索引

简介: 什么是倒排索引

一个未经处理的数据库中,一般是以文档 ID 作为索引,以文档内容作为记录。


而 Inverted index 指的是将单词或记录作为索引,将文档 ID 作为记录,这样便可以方便地通过单词或记录查找到其所在的文档。所以说,倒排适合全文检索的情况。


倒排索引, 其实和我们人脑搜索信息的过程是类似的。


我们人脑对于信息和数据存在大脑里, 不会有编号的。 不会说拿出一个编号为10 的文章内容。


我们是通过一句话的关键字, 通过关键字找我们之前大脑里面和关键字有关系的内容,可能是一些小片段。 但关键字和这些小片段的联系是事先建立好的,在我们的大脑里。 而这些小片段我们可以把它们看作更丰富内容的标题。 通过这些标题,好像提示一样, 我们可以联想起更多的内容。


有 ID 什么事呢? 没有 ID.


image.png


Reference:

https://zhuanlan.zhihu.com/p/37638693



目录
相关文章
|
8月前
|
搜索推荐 算法 数据库
正排索引 vs 倒排索引 - 搜索引擎具体原理
正排索引 vs 倒排索引 - 搜索引擎具体原理
229 4
|
8月前
|
搜索推荐 Java Shell
1.全文检索
1.全文检索
|
存储 XML 自然语言处理
【Solr】之倒排索引算法【字典树】2
【Solr】之倒排索引算法【字典树】2
134 0
【Solr】之倒排索引算法【字典树】2
|
存储 关系型数据库 MySQL
|
存储 自然语言处理 数据库
5分钟了解lucene全文索引
本文通俗地介绍了Lucene全文检索的内容及工作原理,以及索引的结构,旨在让以前未了解过Lucene的读者在能在短时间内对Lucene有简单认知,未介绍具体代码,读完本文可知道Lucene是什么,有哪些具体应用,我们一直说的索引是什么。
|
自然语言处理 算法 索引
|
存储 自然语言处理 Java
Lucene & 全文检索
目录结构:1.全文检索 2.Lucene入门3.Lucene进阶 全文检索 一, 生活中的搜索: 1.Windows系统中的有搜索功能:打开“我的电脑”,按“F3”就可以使用查找的功能,查找指定的文件或文件夹。
1269 0
|
测试技术 索引 搜索推荐
全文检索 Lucene(4)
经过了前面几篇文章的学习,我们基本上可以适用Lucene来开发我们的站内搜索应用了。但是观察一下目前的主流的搜索引擎,我们会发现查询结果会有高亮的显示效果。所以,今天我们就来学习一下,给Lucene添加以下高亮的显示效果。
1023 0

热门文章

最新文章