ElasticSearch集群分片副本数据路由实现原理剖析-开发者社区-阿里云

分布式系列教程（36） -ElasticSearch集群原理

2023-11-08 533

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 分布式系列教程（36） -ElasticSearch集群原理

1.引言

ES是一个分布式全文检索框架，隐藏了复杂的处理机制，核心内容分片机制、集群发现、分片负载均衡请求路由。

1.1 ES基本概念名词

Cluster:

代表一个集群，集群中有多个节点，其中有一个为主节点，这个主节点是可以通过选举产生的，主从节点是对于集群内部来说的。es的一个概念就是去中心化，字面上理解就是无中心节点，这是对于集群外部来说的，因为从外部来看es集群，在逻辑上是个整体，你与任何一个节点的通信和与整个es集群通信是等价的。

Shards:

代表索引分片，es可以把一个完整的索引分成多个分片，这样的好处是可以把一个大的索引拆分成多个，分布到不同的节点上，构成分布式搜索。分片的数量只能在索引创建前指定，并且索引创建后不能更改。

Replicas:

代表索引副本，es可以设置多个索引的副本，副本的作用一是提高系统的容错性，当某个节点某个分片损坏或丢失时可以从副本中恢复，二是提高es的查询效率，es会自动对搜索请求进行负载均衡。

Recovery:

代表数据恢复或叫数据重新分布，es在有节点加入或退出时会根据机器的负载对索引分片进行重新分配，挂掉的节点重新启动时也会进行数据恢复。

1.2 ES为什么要实现集群

ES集群中索引可能由多个分片构成，并且每个分片可以拥有多个副本。

通过将一个单独的索引分为多个分片，我们可以处理不能在一个单一的服务器上面运行的大型索引，简单的说就是索引的大小过大，导致效率问题。

不能运行的原因可能是内存也可能是存储。由于每个分片可以有多个副本，通过将副本分配到多个服务器，可以提高查询的负载能力。

2. ES集群核心原理分析

每个索引会被分成多个分片shards进行存储，默认创建索引是分配5个分片进行存储。每个分片都会分布式部署在多个不同的节点上进行部署，该分片成为primary shards。（注意：索引的主分片primary shards定义好后，后面不能做修改。）

为了实现高可用数据的高可用，主分片可以有对应的备分片replics shards，replic shards分片承载了负责容错、以及请求的负载均衡。(注意: 每一个主分片为了实现高可用，都会有自己对应的备分片，主分片对应的备分片不能存放同一台服务器上。主分片primary shards可以和其他replics shards存放在同一个node节点上。)

每一个主分片为了实现高可用，都会有自己对应的备份分片，主分片对应的备分片不能存放在同一台服务器上，如下图：

2.1 总分片数计算

注意：主分片对应的备分片不能存放同一台服务器上

如果主分片为3、备分片为1 ，每个主分片对应1个备分片，3个主分片放在3个节点（服务器）的情况下:

总分片数 = 3（仓库数）*1（主分片）+ 1（备份分片）*3 = 6个

如果主分片为3、备分片为2 ，每个主分片对应2个备分片，3个主分片放在3个节点（服务器）的情况下:

总分片数 = 3（仓库数）*1（主分片）+ 2（备份分片）*3 = 9个

注意：因为主分片为2，增加一台服务节点，当前服务节点为3台，又因为主分片不能修改，那么只能提高备份分片了。

2.2 数据路由

当客户端发起创建document的时候，es需要确定这个document放在该index哪个shard上。这个过程就是数据路由。

路由算法：shard = hash(routing) % number_of_primary_shards

为什么ES索引主分片数量不能改?

答：如果number_of_primary_shards在查询的时候取余发生的变化，无法获取到该数据。

分布式系列教程（36） -ElasticSearch集群原理