Elastic实战: 集群报黄如何处理

简介: 集群的有三种状态:绿色:正常状态,表示主副分片都正常黄色:主分片正常,至少一个副本分片不可用,该状态下仍然可以正常查询红色:至少一个主分片不可用,可以查询到部分数据,但是数据不具备完整性

0、引言

今天群里有小伙伴讨论公司集群报黄的问题,特此记录,以供后续的同学参考

1、原因

集群的有三种状态:
绿色:正常状态,表示主副分片都正常
黄色:主分片正常,至少一个副本分片不可用,该状态下仍然可以正常查询
红色:至少一个主分片不可用,可以查询到部分数据,但是数据不具备完整性

2、解决

由上述表示可知,集群报黄归根结底是一个原因,至少一个副本分片不可用。但是造成这个情况的形式不止一种,目前已知的有:

2.1 副本分片数过大

主副分片是不允许在同一节点上的,如果副本分片数设置的过大,导致副本分片无节点可分配的话就会导致这个问题。而这里的过大也是相对于集群节点数而言的,如果是单节点集群,副本分片数即使为1也是过大,因为肯定会和主分片处在同一个节点上。

可以通过以下指令排查

# 查询分片状态,观察哪些索引是yellow
GET _cat/shards?v
# 找到yellow 索引,查询settings
GET <index>/_settings

解决

1、手动设置副本分片数,将其调整为0或者一个合适值:

PUT /cs_indexs/_settings
{
  "number_of_replicas": 0
}

需要注意的是,副本分片的作用是主分片的备份,所以如果设置为0的话就意味着没有备份了。

2、增加节点数量也可解决此类问题

2.2 磁盘占用数超85%

官方文档中有记录,默认是不会将分片分配给磁盘占用率超85%的节点的,所以检查下你服务器的磁盘占用量
在这里插入图片描述
可以通过df -h指令查看磁盘占用量
在这里插入图片描述

解决

1、拓展磁盘空间
2、删除无用索引数据

2.3 网络问题

节点无法连接到集群,自然会使节点无法分配分片,也会导致报黄设置报红。当集群出现一会报黄一会正常的情况,就要考虑下是否是某部分节点存在网络波动或者其他问题导致连接不稳定

如果上述两种情况都不满足的话,排查一下是否是网络的问题。

用docker安装的集群,要重点排查下这种情况

如果你还遇到其他的情况,请留言告诉我

目录
相关文章
|
3月前
|
存储 SQL Serverless
Serverless 应用引擎常见问题之POD自动重启如何解决
Serverless 应用引擎(Serverless Application Engine, SAE)是一种完全托管的应用平台,它允许开发者无需管理服务器即可构建和部署应用。以下是Serverless 应用引擎使用过程中的一些常见问题及其答案的汇总:
|
2月前
|
缓存 安全 Java
Elasticsearch—生产环境集群核心配置
Elasticsearch—生产环境集群核心配置
27 0
|
3月前
|
Dubbo Java Serverless
Serverless 应用引擎操作报错合集之Nacos中nacos启动正常,访问白页,启动日志显示正常如何解决
Serverless 应用引擎(SAE)是阿里云提供的Serverless PaaS平台,支持Spring Cloud、Dubbo、HSF等主流微服务框架,简化应用的部署、运维和弹性伸缩。在使用SAE过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
132 0
Serverless 应用引擎操作报错合集之Nacos中nacos启动正常,访问白页,启动日志显示正常如何解决
|
3月前
|
SQL 消息中间件 Kubernetes
flink问题之on kubernetes 构建失败如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
|
3月前
|
Java Serverless Nacos
nacos常见问题之serverless应用引擎连接异常如何解决?
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
|
9月前
|
存储 负载均衡 算法
分布式系列教程(36) -ElasticSearch集群原理
分布式系列教程(36) -ElasticSearch集群原理
73 0
|
12月前
|
分布式计算 大数据 API
完美避坑!记一次Elasticsearch集群迁移架构实战
Elastic自身设计了集群分片的负载平衡机制,当有新数据节点加入集群或者离开集群,集群会自动平衡分片的负载分布。
|
存储 搜索推荐 API
Elasticsearch集群工作原理
ELasticsearch作为一个分布式搜索引擎,能够出色地支持集群模式、动态水平扩容、故障转移等分布式系统特性,这是其作为全文搜索引擎首选的重要原因。 本文从零开始描述集群的配置和扩容过程,让你对Elasticsearch集群的工作原理有初步的理解。
338 0
Elasticsearch集群工作原理
|
存储 缓存 监控
带你读《Elastic Stack 实战手册》之82:——4.3.1.Elasticsearch 生产环境集群部署最佳实践(2)
带你读《Elastic Stack 实战手册》之82:——4.3.1.Elasticsearch 生产环境集群部署最佳实践(2)
103 0
|
存储 缓存 固态存储
带你读《Elastic Stack 实战手册》之82:——4.3.1.Elasticsearch 生产环境集群部署最佳实践(1)
带你读《Elastic Stack 实战手册》之82:——4.3.1.Elasticsearch 生产环境集群部署最佳实践(1)
137 0