什么是倒排索引

简介: 什么是倒排索引

一个未经处理的数据库中,一般是以文档 ID 作为索引,以文档内容作为记录。


而 Inverted index 指的是将单词或记录作为索引,将文档 ID 作为记录,这样便可以方便地通过单词或记录查找到其所在的文档。所以说,倒排适合全文检索的情况。


倒排索引, 其实和我们人脑搜索信息的过程是类似的。


我们人脑对于信息和数据存在大脑里, 不会有编号的。 不会说拿出一个编号为10 的文章内容。


我们是通过一句话的关键字, 通过关键字找我们之前大脑里面和关键字有关系的内容,可能是一些小片段。 但关键字和这些小片段的联系是事先建立好的,在我们的大脑里。 而这些小片段我们可以把它们看作更丰富内容的标题。 通过这些标题,好像提示一样, 我们可以联想起更多的内容。


有 ID 什么事呢? 没有 ID.


image.png


Reference:

https://zhuanlan.zhihu.com/p/37638693



目录
相关文章
|
存储 自然语言处理 数据库
ClickHouse中的倒排索引能解决你什么问题?
ClickHouse中的倒排索引能解决你什么问题?
38193 3
ClickHouse中的倒排索引能解决你什么问题?
|
6月前
|
搜索推荐 算法 数据库
正排索引 vs 倒排索引 - 搜索引擎具体原理
正排索引 vs 倒排索引 - 搜索引擎具体原理
159 4
|
6月前
|
搜索推荐 Java Shell
1.全文检索
1.全文检索
|
自然语言处理 算法 UED
全文搜索
全文搜索树设计思路
115 0
|
自然语言处理 算法 搜索推荐
使用倒排索引极速提高字符串搜索效率
使用倒排索引极速提高字符串搜索效率
89 0
|
存储 XML 自然语言处理
【Solr】之倒排索引算法【字典树】2
【Solr】之倒排索引算法【字典树】2
127 0
【Solr】之倒排索引算法【字典树】2
|
存储 关系型数据库 MySQL
|
SQL 存储 搜索推荐
什么是全文检索
全文检索技术被广泛的应用于搜索引擎,查询检索等领域。我们在网络上的大部分搜索服务都用到了全文检索技术。 对于数据量大、数据结构不固定的数据可采用全文检索方式搜索,比如百度、Google等搜索引擎、论坛站内搜索、电商网站站内搜索等。
630 0
什么是全文检索
|
存储 自然语言处理 数据库
5分钟了解lucene全文索引
本文通俗地介绍了Lucene全文检索的内容及工作原理,以及索引的结构,旨在让以前未了解过Lucene的读者在能在短时间内对Lucene有简单认知,未介绍具体代码,读完本文可知道Lucene是什么,有哪些具体应用,我们一直说的索引是什么。