【Elasticsearch 入门公开课】在Docker环境中,实操详解 ELK 基本概念-回顾篇(2)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 『Elasticsearch 入门课程23讲』目前已播出至第10讲,本周通过阮一鸣老师细致的讲解及实操,让大家了解如何通过 Docker 运行 Elasticsearch Kibana 、如何安装 Logstash 并导入数据 、对 Elasticsearch 关于索引、文档、REST API、节点、集群、分片及副本有了一个系统的了解。

讲师:阮一鸣——eBay Pronto 平台技术负责人、极客时间『Elasticsearch 核心技术与实战』课程讲师
课程为了更多同学能快速体验 Elasticsearch,为大家提供了免费的阿里云 Elasticsearch (3节点1核2G)的测试环境>>>>去开通

image.png

课程回顾

7 | 在Docker容器中运行Elasticsearch Kibana和 Cerebro
8 | Logstash安装与导入数据
9 | 基本概念:索引、文档和REST API
10 | 基本概念:节点、集群、分片及副本

知识点一:在 Docker 容器中运行 Elasticsearch Kibana和 Cerebro

lasticsearch 成立之初就开始拥抱容器技术,官方不仅提供 Docker Image,同时在2019年5月,在发布7.1版本时,免费支持并提供 Elatic Operator on Kubernetes。而Cerebro 可以很好的让大家学习了解 Elasticsearch 分布式特性。

image.png

关于在本机运行 Docker 环境去启动 Elasticsearch 有两点好处

  • 可以通过一行命令,快速搭建环境
  • 非常快捷的清除数据

Demo 部分请跟随课程,动手试试吧

image.png

课程相关资料访问及下载

下载安装 Docker 与 Docker Compose
https://www.docker.com
https://docs.docker.com/compose
https://docs.docker.com/machine/install-machine/

Docker - Compose 相关命令

• 运行 Docker- compose up
• docker Compose down
• docker Compose down - v
• docker stop / rm containerID

GitHub:https://github.com/onebirdrocks/geektime-ELK/


知识点二:Logstash 安装与导入数据

我们通过 Elastic 官网下载并安装 Logstash,并在 Docker 本地运行,下载需要确保版本号跟 Elasticsearch 相一致;

image.png

下载安装 Logstash:

http://www.elastic.co/downloads/logstash
开通阿里云 Logstash 2核4G 1个月免费测试环境_点击开通

通过Movieiens 测试数据集,写了一个配置文件,并通过 Logstash 将这些数据写入 Elasticsearch,这些测试数据对于我们学习查询 Elasticsearch 起到非常关键的作用

image.png

下载 Movie Len 数据:

https://grouplens.org/datasets/movielens/

Demo 部分请跟随课程,动手试试吧

image.png

知识点三:基本概念(1)- 索引,文档和 REST API

Elasticsearch 中的“索引”和“文档”是一个逻辑概念,偏向与开发者视角;“文档”是所有可能搜索数据的最小单位,“索引”是相似文档的集合。

image.png

关于“文档”

在 Elasticsearch 中,“文档”以序列化成 JSON 格式保存,每个文档均对应一个 Unique ID和元数据,如 【_index-索引名】、【_type-类型名】等

image.png

关于“索引”

在 Elasticsearch 中“索引”是相似文档的集合,每一个“索引”都有属于自己的 Mapping 定义文档,用于描述包含的字段名和类型。每一个索引可以创建一个 “Type”(Elasticsearch 7.0之后),每个“Type”底下有相同结构的文档。

image.png

与关系型数据库类比时,当用于全文检索,Elasticsearch 比较有优势,往往会将Elasticsearch 与数据库组合使用。

image.png

关于“REST API”

“REST API”是 Elasticsearch 为了方便其他语言整合,对程序做调用。当程序需要与 Elasticsearch 做集成时,我们仅需发出 HTTP 的请求,就可以得到相应的结果。

image.png

Demo 部分请跟随课程,动手试试吧

• 查看一些与 index 的相关 API
• 进入 Kinbana Index Management 界面,探索 Index 相关的信息

知识点四:基本概念(2)- 集群 / 节点 / 分片 / 副本

关于“集群”

Elasticsearch 的“集群”是一个分布式集群,满足“高可用”、“可拓展”的特性。不仅提供存储的水平扩容,而且当出现部分节点停止服务,也不影响整个集群的服务。
Elasticsearch 官方也提供 CAT API,来帮助了解“集群”健康状况,用“green”、“yellow”、“red”,分别代表集群“主、副分片分配正常”、“主分片正常分配,副本未正常分配”、“主分片未正常分配

image.png

关于“节点”

“节点”是一个 Elasticsearch 的实例,本质上是一个 JAVA 的进程,当节点启动后,系统会分配一个 UID,保存着在 Data 目录下。

不同的节点,会承担不同的角色

image.png

其他还有很多类型节点,比如需要做日志 Case 时,有“Hot & Warm Node”、用于机器学习的“Machine Learning Node”;

每个节点启动,都会读取 Elasticsearch YML 配置文件,用于决定自己承担说明角色

image.png

关于“分片/副本”

“分片”分为 Primary Shard & Replica Shard(主、副分片)

image.png

通过分片,将数据分布在集群节点上,生产环境中,需要提前规划分片容量

当分片设置过小

  1. 导致后续无法增加节点实现水平扩展
  2. 当分片数据量超过容量,重新分配数据会耗费过多时间

当分片设置过大

  1. 影响搜索结果相关性打分。
  2. 导致统计不准确,影响性能造成浪费。

image.png

Demo 部分请跟随课程,动手试试吧

• 查看一个集群的健康状态 http://localhost:9200/_cluster/health
• CAT API

  1. http://localhost:9200/_cat/nodes
  2. 查看索引和分片

• 设置分片数
• Kibana+Cerebro 界面介绍

下周课程预告


点击预约课程

11 | 文档的基本CRUD与批量操作
12 | URI Search详解
13 | 通过Analyzer进行分词
14 | Search API概览

相关活动


更多折扣活动,请访问阿里云 Elasticsearch 官网

• 阿里云 Elasticsearch 商业通用版,1核2G首月免费
阿里云 Elasticsearch 日志增强版,首月六折,年付六折
阿里云 Logstash 2核4G首月免费


image.png

image.png

相关实践学习
利用Elasticsearch实现地理位置查询
本实验将分别介绍如何使用Elasticsearch7.10版本进行全文检索、多语言检索和地理位置查询三个Elasticsearch基础检索子场景的实现。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
2月前
|
弹性计算 运维 Linux
Docker环境如何配置?使用阿里云OOS一步搞定!
阿里云OOS简化了ECS上应用部署,提供Docker一键安装服务。支持多种操作系统,包括Alibaba Cloud Linux、CentOS、Ubuntu、Debian和Windows Server。要安装Docker,用户只需在OOS扩展程序中选择并确认实例,执行安装。OOS扩展程序还支持Java、Python等开发环境及宝塔面板、WordPress等应用的快速配置,提升运维效率,让云资源管理更便捷。
53487 3
Docker环境如何配置?使用阿里云OOS一步搞定!
|
2月前
|
Docker 容器
paddleocr 在docker环境下部署_docker部署paddleocr,90%的人看完都说好
paddleocr 在docker环境下部署_docker部署paddleocr,90%的人看完都说好
|
2月前
|
SQL API 流计算
实时计算 Flink版产品使用合集之在Mac M1下的Docker环境中开启SQL Server代理的操作步骤是什么
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
175 1
|
1天前
|
Docker 容器
docker desktop安装es并连接elasticsearch-head:5
以上就是在Docker Desktop上安装Elasticsearch并连接Elasticsearch-head:5的步骤。
11 2
|
4天前
|
监控 数据可视化 Linux
使用Portainer图形化工具轻松管理远程Docker环境并实现远程访问
使用Portainer图形化工具轻松管理远程Docker环境并实现远程访问
|
28天前
|
Docker 容器
蓝易云 - docker之Consul环境的部署
注意,这只是一个基本的Consul环境的部署。在生产环境中,你可能需要配置更多的选项,如数据持久化、网络设置等。
23 1
|
1月前
|
Docker 容器
蓝易云 - docker环境安装软件、更换镜像源以及E: Unable to locate package xxx解决
"E: Unable to locate package xxx"这个错误通常意味着APT包管理器无法找到你想要安装的软件包。可能的原因包括:软件包名称错误,软件包不存在,或者软件源没有更新。可以尝试更新软件源(`apt-get update`),确保软件包名称正确,或者更换软件源解决这个问题。
209 1
|
10天前
|
Linux Docker 容器
Docker02--搭建Linux环境,配置Docker,docker images无法访问,因为docker没有启动,阿里云镜像加速器免费的
Docker02--搭建Linux环境,配置Docker,docker images无法访问,因为docker没有启动,阿里云镜像加速器免费的
|
1月前
|
机器人 开发工具 计算机视觉
基于 docker 环境的 LET-VINS 复现
该文介绍了在Docker环境下实践LET-NET的步骤。从GitHub克隆LET-NET代码,使用Docker运行vins-mono环境。安装ncnn,配置代理,更新源,安装依赖并验证安装成功。在运行LET-NET时遇到opencv版本不兼容,指出怎么安装指定版本的 opencv。解决Docker容器中的显示问题,通过`xhost +`命令运行LET-NET。在ROS中构建VINS-Mono时,cv_bridge找不到的问题,通过安装cv_bridge,设置ROS环境和工作空间,以及解决ncnn的配置问题,最终成功运行VINS-Mono。还需要下载UMA-VI数据集并修改相关路径以运行演示。
|
1月前
|
机器学习/深度学习 安全 测试技术
【Docker项目实战】在Docker环境下使用RustScan端口扫描工具
【6月更文挑战第9天】在Docker环境下使用RustScan端口扫描工具
38 5

热门文章

最新文章

相关产品

  • 检索分析服务 Elasticsearch版