什么是倒排索引

简介: 什么是倒排索引

一个未经处理的数据库中,一般是以文档 ID 作为索引,以文档内容作为记录。


而 Inverted index 指的是将单词或记录作为索引,将文档 ID 作为记录,这样便可以方便地通过单词或记录查找到其所在的文档。所以说,倒排适合全文检索的情况。


倒排索引, 其实和我们人脑搜索信息的过程是类似的。


我们人脑对于信息和数据存在大脑里, 不会有编号的。 不会说拿出一个编号为10 的文章内容。


我们是通过一句话的关键字, 通过关键字找我们之前大脑里面和关键字有关系的内容,可能是一些小片段。 但关键字和这些小片段的联系是事先建立好的,在我们的大脑里。 而这些小片段我们可以把它们看作更丰富内容的标题。 通过这些标题,好像提示一样, 我们可以联想起更多的内容。


有 ID 什么事呢? 没有 ID.


image.png


Reference:

https://zhuanlan.zhihu.com/p/37638693



目录
相关文章
|
消息中间件 安全 Java
Kafka消息发送的三种模式
消息队列Kafka版是阿里云提供的分布式、高吞吐、可扩展的消息队列服务。消息队列Kafka版广泛用于日志收集、监控数据聚合、流式数据处理、在线和离线分析等大数据领域,已成为大数据生态中不可或缺的部分。目前发送端支持三种消息发送模式:发后即忘(fire-and-forget)、同步(sync)和异步(async)。
5454 0
|
10月前
|
人工智能 算法 搜索推荐
AI宠物 适合当代年轻人吗
在当今社会,年轻人面临巨大工作压力和社交时长受限的挑战,AI宠物应运而生。它无需实际喂养,能24小时在线互动,提供情感支持,满足现代年轻人对陪伴的需求。相较于传统宠物,AI宠物无需专门空间和额外成本,却能通过算法学习主人习惯,给予贴心陪伴。未来,AI宠物有望在心理健康辅导等领域发挥更大作用,为人们带来多元的情感体验。
|
11月前
|
消息中间件 存储 负载均衡
Apache Kafka核心概念解析:生产者、消费者与Broker
【10月更文挑战第24天】在数字化转型的大潮中,数据的实时处理能力成为了企业竞争力的重要组成部分。Apache Kafka 作为一款高性能的消息队列系统,在这一领域占据了重要地位。通过使用 Kafka,企业可以构建出高效的数据管道,实现数据的快速传输和处理。今天,我将从个人的角度出发,深入解析 Kafka 的三大核心组件——生产者、消费者与 Broker,希望能够帮助大家建立起对 Kafka 内部机制的基本理解。
327 2
|
存储 Shell API
Casbin是一个强大的、开源的访问控制库,支持访问控制模型如ACL、RBAC、ABAC等。
Casbin是一个强大的、开源的访问控制库,支持访问控制模型如ACL、RBAC、ABAC等。
|
Python
Fastapi进阶用法,路径参数,路由分发,查询参数等详解
Fastapi进阶用法,路径参数,路由分发,查询参数等详解
1034 1
|
消息中间件 负载均衡 监控
【Kafka】Kafka 创建Topic后如何将分区放置到不同的 Broker 中?
【4月更文挑战第13天】【Kafka】Kafka 创建Topic后如何将分区放置到不同的 Broker 中?
|
Java
SpringBoot启动指定配置文件路径
SpringBoot启动指定配置文件路径
610 0
|
安全 Java 调度
HashMap很美好,但线程不安全怎么办?ConcurrentHashMap告诉你答案!
HashMap很美好,但线程不安全怎么办?ConcurrentHashMap告诉你答案!
275 1
|
XML Dubbo Java
SpringBoot整合Dubbo的第一种方式——application.properties + @DubboService + @DubboReference
SpringBoot整合Dubbo的第一种方式——application.properties + @DubboService + @DubboReference
1466 0
SpringBoot整合Dubbo的第一种方式——application.properties + @DubboService + @DubboReference
|
JavaScript
Node.js Error: Cannot find module express
Node.js Error: Cannot find module express
433 1