带你读《企业级云原生白皮书项目实战》——5.1.4 集群监控告警(7)

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: 带你读《企业级云原生白皮书项目实战》——5.1.4 集群监控告警(7)

《企业级云原生白皮书项目实战》——第五章 大数据——5.1 检索分析服务 Elasticsearch版——5.1.4 集群监控告警(6) https://developer.aliyun.com/article/1228833?groupCode=supportservice


5.1.4.3 Kibana监控告警

5.1.4.3.1 Kibana监控

kibana监控分为Elasticsearch和Kibana两个服务,其中Elasticsearch日常使用较多的主要是Overview、Nodes、Indices三个模块。Overview、Nodes、Indices都是可以看到集群的整体状态、节点数量、数索引数、shard数量、文档数量、存储大小等数据。

Overview是监控概览,可以查看到集群整体的查询和索引的速率和延迟,需要注意的是Search Rate (/s)是每秒主分片和副本分片的整体请求速率,而Indexing Rate (/s)是每秒写入的文档数量。

Nodes是节点维度监控数据,可以看到每个节点的状态、UPU、负载、jvm 内存、磁盘空闲空间、shard数量。

indices是索引维度监控数据,可以查看到索引的名字、索引的状态、索引文档数量、索引数据大小、索引的写入速率、索引的查询速率,以及未分配的shard数量。

而Kibana主要有Overview和Instances两个模块,其中Overview是概览,主要可以查看到实例状态、节点数量、整体内存和当前使用内存、请求数量、客户端数量、最大响应时间,客户端请求总量、客户端响应时间(最大值和平均值),而Instances可以看到实例维度的状态、负载平均值、当前使用内存大小、请求数量、响应时间。


5.1.4.3.2 Kibana告警

kibana的告警能力是基于X-Pack Watcher的,X-Pack Watcher功能主要由Trigger、Input、Condition和Actions四部分组成,详细说明如下TriggerWatcher定时触发器,即多久触发一次Watcher,相当于多久执行一次input。支持多种调度触发器,详细信息请参见Schedule Trigger。

InputInput将数据加载到执行上下文,用于后续的Watcher执行阶段,如果input没有指定,将会加载一个空上下文,详细信息请参见Inputs。Watcher支持以下input类型:

•simple:将输入静态数据加载到执行上下文。例如手动输入一段简单的数据进行报警。

•search:将搜索结果加载到执行上下文。例如全文搜索关键词,对搜索结果进行统计实现报警。

•http:将HTTP请求结果加载到执行上下文。例如通过Elasticsearch请求接口获取集群健康状态、节点状态等实现报警。

•chain:将一系列的输入数据加载到执行上下文,这些数据一般是来自多个源。

Condition执行Actions的条件。即满足条件将会触发下一步操作,如果不指定条件,默认为always,详细信息请参见Conditions。Watcher支持以下condition类型:

•always:条件总为true,始终执行Watcher Actions。

•nerver:条件总为false,从不执行Watcher Actions。

•compare:对Watcher有效负载中的值进行简单比较,以确定是否执行Watcher Actions。

•array_compare:将Watcher有效负载中的值数组与给定值进行比较,以确定是否执行Watcher Actions。

•script:使用脚本确定是否执行Watcher Actions。

Actions报警接收对象,常见的报警接收对象包括邮件、Webhook 、index和logging等,详细信息请参见Actions。

由于 Kibana告警是依赖ES本身的服务,所以实际的告警数据,是ES集群节点发送出来的,这样需考虑下网络联通性,自2020年10月起,阿里云Elasticsearch对不同地域进行了网络架构的调整,对创建的实例有以下影响,2020年10月之前创建的实例均在旧网络架构下,即Elasticsearch实例处于用户VPC下,如果需要访问公网,可以直接使用SNAT功能或自建Nginx代理。2020年10月及之后创建的实例均在

新网络架构下,即Elasticsearch实例处于Elasticsearch服务VPC下,X-Pack Watcher功能受到网络限制,为解决此问题,阿里云Elasticsearch提供了实例私网连接方案,也就是PrivateLink方案,详细网络架构我们在5.1.7.1.3章节有说明。如果还需要将报警信息推送至公网环境,在通过实例私网连接打通Elasticsearch服务VPC和用户VPC的基础上,还需对负载均衡后端服务配置Nginx代理或开启SNAT功能实现公网信息推送。

注意:通过邮件接收报警存在端口限制,阿里云Elasticsearch不支持,建议通过Webhook进行邮件转发。


《企业级云原生白皮书项目实战》——第五章 大数据——5.1 检索分析服务 Elasticsearch版——5.1.4 集群监控告警(8) https://developer.aliyun.com/article/1228828?groupCode=supportservice

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
5月前
|
人工智能 关系型数据库 OLAP
光云科技 X AnalyticDB:构建 AI 时代下的云原生企业级数仓
AnalyticDB承载了光云海量数据的实时在线分析,为各个业务线的商家提供了丝滑的数据服务,实时物化视图、租户资源隔离、冷热分离等企业级特性,很好的解决了SaaS场景下的业务痛点,也平衡了成本。同时也基于通义+AnalyticDB研发了企业级智能客服、智能导购等行业解决方案,借助大模型和云计算为商家赋能。
371 17
|
6月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
阿里云PolarDB云原生数据库在TPC-C基准测试中以20.55亿tpmC的成绩刷新世界纪录,展现卓越性能与性价比。其轻量版满足国产化需求,兼具高性能与低成本,适用于多种场景,推动数据库技术革新与发展。
|
4月前
|
存储 缓存 分布式计算
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
本文将深入探讨基于 StarRocks 和 Iceberg 构建的云原生湖仓分析技术,详细解析两者结合如何实现高效的查询性能优化。内容涵盖 StarRocks Lakehouse 架构、与 Iceberg 的性能协同、最佳实践应用以及未来的发展规划,为您提供全面的技术解读。 作者:杨关锁,北京镜舟科技研发工程师
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
|
3月前
|
Cloud Native 关系型数据库 分布式数据库
客户说|知乎基于阿里云PolarDB,实现最大数据库集群云原生升级
近日,知乎最大的风控业务数据库集群,基于阿里云瑶池数据库完成了云原生技术架构的升级。此次升级不仅显著提升了系统的高可用性和性能上限,还大幅降低了底层资源成本。
|
5月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
|
5月前
|
弹性计算 运维 算法
阿里云 Elasticsearch Serverless 检索增强型 8.17 版来袭!
阿里云Elasticsearch Serverless 8.17版本,深度融合无服务器架构与分层扩展能力,面向信息检索、向量搜索、语义分析等通用场景,提供全托管服务,在最新特性扩展、自动扩缩性能、资源成本优化等维度均有显著提升。
235 15
|
11月前
|
自然语言处理 大数据 应用服务中间件
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
207 5
|
11月前
|
存储 分布式计算 大数据
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
158 3
|
6月前
|
运维 Kubernetes Cloud Native
云栖实录 | 智能运维:云原生大规模集群GitOps实践
云栖实录 | 智能运维:云原生大规模集群GitOps实践
198 1
|
6月前
|
存储 机器学习/深度学习 人工智能
Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名
本文介绍了如何将阿里云 AI 功能与 Elasticsearch 集成,以提高语义搜索的相关性。
348 0

热门文章

最新文章