索引和搜索流程简介|学习笔记

简介: 快速学习索引和搜索流程简介

开发者学堂课程【Lucene 知识精讲与实战(上) 索引和搜索流程简介】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/700/detail/12327


索引和搜索流程简介


整体了解索引和搜索流程

image.png

1、创建索引

中间的索引库就是 Lucene,要想从索引库中搜索数据,必须先继承索引。

首先找到数据在原始的这个地方,原始的地方有可能是数据库,也有可能是在文本文档当中,也有可能是来源于互联网,要获得这个原始数据,要通过接触地区,把它给读出来,如果说这个原始数据在文本文档当中,可以通过 I/O 流获得这个文档,要是来源于互联网,可以通过查重方式,来把这个数据查询出来,拿到这个数据之后要构建文档对象,然后分析数据(切分词),最后创建索引。索引流程完成并且存到索引库。

2、搜索流程

用户通过浏览器页面发送一个查询请求到我们的项目,在项目当中有那个查询语法,通过查询语法去到索引库当中去查,查完之后,返回结果到项目当中,项目再把结果和页面进行渲染反馈给用户浏览器。

并非我们查询之前限制索引,得看你是什么网站,如果说是想 Baidu 和 Google 这样的整个互联网引擎,他们的查重方式不休止的像各种网站去查。像京东和 Taobao 这些商业网站是怎么做得呢?它的商品添加完之后要进行审核,上架。

在上架的时候会把这个商品的数据从数据库中提取出来放到索引库当中,通过客户的浏览器就能查到了。

不同的网站索引的时间节点是不一样的,总的来说在搜索之前已经把数据放到索引库当中了,这样查询的速度才快。

索引过程包括:

1)获得文档;

2)创建文档;

3)分析文档;

4)索引文档;

相关文章
|
6月前
|
存储 搜索推荐 安全
Onlyfans如何使用搜索功能?Onlyfans如何搜索博主?如何在OnlyFans搜索HongkongDoll
本文是一份全面的指南,旨在帮助读者了解如何在OnlyFans平台上有效使用搜索功能,尤其是如何找到特定的博主,比如HongkongDoll。我们深入探讨了OnlyFans的搜索机制,包括其对用户隐私的重视以及因此带来的搜索限制。文章详细介绍了三种主要的搜索方法:使用OnlyFans的官方搜索服务、通过社交媒体链接进行跳转、以及利用第三方搜索引擎如OnlySearch。
|
3月前
|
SQL JSON 大数据
ElasticSearch的简单介绍与使用【进阶检索】 实时搜索 | 分布式搜索 | 全文搜索 | 大数据处理 | 搜索过滤 | 搜索排序
这篇文章是Elasticsearch的进阶使用指南,涵盖了Search API的两种检索方式、Query DSL的基本语法和多种查询示例,包括全文检索、短语匹配、多字段匹配、复合查询、结果过滤、聚合操作以及Mapping的概念和操作,还讨论了Elasticsearch 7.x和8.x版本中type概念的变更和数据迁移的方法。
ElasticSearch的简单介绍与使用【进阶检索】 实时搜索 | 分布式搜索 | 全文搜索 | 大数据处理 | 搜索过滤 | 搜索排序
|
5月前
|
SQL 数据管理 关系型数据库
数据管理DMS操作报错合集之执行列表模糊搜索,无法搜到对应表的记录,是什么原因
数据管理DMS(Data Management Service)是阿里云提供的数据库管理和运维服务,它支持多种数据库类型,包括RDS、PolarDB、MongoDB等。在使用DMS进行数据库操作时,可能会遇到各种报错情况。以下是一些常见的DMS操作报错及其可能的原因与解决措施的合集。
|
6月前
|
数据采集 存储 搜索推荐
使用Python构建自定义搜索引擎:从数据抓取到索引与搜索
使用Python构建自定义搜索引擎:从数据抓取到索引与搜索
356 0
|
小程序 数据库
小程序搜索功能,云开发搜索,小程序云开发模糊搜索,同时搜索多个字段
小程序搜索功能,云开发搜索,小程序云开发模糊搜索,同时搜索多个字段
274 0
|
前端开发
前端学习案例-搜索参数2
前端学习案例-搜索参数2
51 0
前端学习案例-搜索参数2
|
前端开发
前端学习案例-搜索参数
前端学习案例-搜索参数
76 0
前端学习案例-搜索参数
|
存储 并行计算 算法
秒懂算法 | 搜索基础
本篇介绍了BFS和DFS的概念、性质、模板代码。
157 0
秒懂算法 | 搜索基础
|
自然语言处理 数据库 索引
全文检索工具elasticsearch:第四章:开发电商的搜索列表功能
全文检索工具elasticsearch:第四章:开发电商的搜索列表功能
220 0
全文检索工具elasticsearch:第四章:开发电商的搜索列表功能