ES 工作原理|学习笔记

简介: 快速学习 ES 工作原理。

开发者学堂课程【ElasticSearch 最新快速入门教程ES 工作原理】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/642/detail/10589


ES 工作原理

 

内容介绍:

一、ES 定义

二、ES 工作原理

 

一、ES 定义

ES 是 ElastiSearch 的缩写,ES 是一款基于 Apache Lucene 构建的开源搜索引擎,它采用 Java 编写并使用 Lucene 构建索引、提供搜索功能,

ElasticSearch 的目标是让全文搜索变得简单,开发者可以通过它简单明了的 RestFul API 轻松地实现搜索功能,而不必去面对 Lucene 的复杂性。

ES 能够轻松的进行大规模的横向扩展,以支撑PB级的结构化和非结构化海量数据的处理。

一言以蔽之:

ElasticSearch 是一款基于 Lucene 的实时分布式搜索和分析引擎。

ElasticSearch 设计主要用于云计算中,能够达到实时搜索、稳定、可靠、快速,安装使用也非常方便。

官网: www.elastic.co

打开官网查看一下,

image.png

Elastic 里面包含各种技术,Kibana 是进行数据的可视化,Elasticsearch 是进行数据的索引的搜索引擎,Logstash 是进行数据的采集,后面会对这些框架进行详细的说明。

 

二、ES 工作原理

image.png

首先要搭建一个索引库,一个 ES 集群,这个 ES 的集群里会放很多索引信息,假如百度后台是使用 ES 服务器,那么怎么在这个集群里搜索数据呢?

首先由多个爬虫从互联网上源源不断的抓取数据,再存在百度的索引库中,后台建一个网站进行数据的录入,在网页中输入关键字,然后百度检索相关的数据会送到客户端,然后再通过浏览器把他显示出来。

比如说我们现在搜索的是 elasticsearch 这个关键字,我百度一下,

就这一瞬间后台检索到了11500000个关键信息,为什么这么快呢?

具体步骤 :

1.录入待检索的关键字

2.点击按钮【百度一下】

3.像百度后台的 ES 集群发送请求

4.百度索引库集群针对用户传过来的检索关键进行搜索,将搜索后的结果分页反馈给客户端。

5.浏览器收到了来自远程 ES 服务器反馈的结果,将其解析后显示在页面上。

image.png

除此以外还有两个前提:

前提1:ES 集群实现已经搭建完毕。

前提2:使用网络爬虫的技术从网络上抓取海量的数据,存入到百度的索引库集群中。

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
小程序
小程序一直未提审的原因及解决方案
小程序一直未提审的原因及解决方案
512 11
|
JavaScript API
Vuex状态管理最佳实践
使用Vuex进行状态管理时,有一些最佳实践可以帮助你保持代码清晰、可维护和高效。以下是一些详细的Vuex状态管理最佳实践
448 3
vue2自定义指令-加载指令v-loading和占位图指令v-showimg
vue2自定义指令-加载指令v-loading和占位图指令v-showimg
|
网络安全 虚拟化 Docker
SSH后判断当前服务器是云主机、物理机、虚拟机、docker环境
结合上述方法,您可以对当前环境进行较为准确的判断。重要的是理解每种环境的特征,并通过系统的响应进行综合分析。如果在Docker容器内,通常会有明显的环境标志和受限的资源视图;而在云主机或虚拟机上,虽然它们也可能是虚拟化的,但通常提供更接近物理机的体验,且可通过硬件标识来识别虚拟化平台。物理机则直接反映硬件真实信息,较少有虚拟化痕迹。通过这些线索,您应该能够定位到您所处的环境类型。
924 2
|
Web App开发 JavaScript
技术经验解读:【原创开源项目】EPUBBuilder一款在线的epub电子书编辑工具
技术经验解读:【原创开源项目】EPUBBuilder一款在线的epub电子书编辑工具
698 0
|
分布式计算 资源调度 监控
分布式资源管理和调度架构
分布式资源管理和调度架构
|
Kubernetes 监控 网络协议
在K8S中,如果因为网络原因导致Pod异常,该如何排查?
在K8S中,如果因为网络原因导致Pod异常,该如何排查?
|
SQL 搜索推荐 TensorFlow
【最佳实践】阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎
“图片搜索”是作为导购类网站,比较常见的一种功能,其实现的方式也有多种。但如何做到快速、精准、简单等特性,本文给你答案。
12873 1
【最佳实践】阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎
|
存储 传感器 前端开发
130+ Hooks,解锁React Hooks使用的正确姿势
130+ Hooks,解锁React Hooks使用的正确姿势
1393 0
|
网络协议 Linux 数据安全/隐私保护
本地电脑搭建SFTP服务器,并实现公网访问
本地电脑搭建SFTP服务器,并实现公网访问
1619 0

热门文章

最新文章