《企业级云原生白皮书项目实战》——第五章 大数据——5.1 检索分析服务 Elasticsearch版——5.1.3 变更实例(4) https://developer.aliyun.com/article/1228896?groupCode=supportservice
5.1.3.5 部署和使用跨可用区实例
跨可用区部署可以提升集群的容灾能力,系统会自动选择库存充足的可用区创建集群。在索引配置了副本的情况下,当某一可用区出现故障时,剩余的可用区依然可以不间断地提供服务,显著增强了集群的可用性。同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。
跨可用去部署的操作是在购买阿里云Elasticsearch实例时,可以选择可用区数量。当选择两个或三个可用区时,系统将部署跨可用区的Elasticsearch实例。部署时,系统会自动配置对应个数的可用区,无需手动选择。
跨可用区部署支持单可用区、跨2个可用区、跨3个可用区三种部署方式,各部署方式的适用场景如下
单可用区:普通部署模式,适用于非关键任务型的工作(默认)。跨2个可用区:跨可用区容灾部署模式,适用于生产型的工作,索引的副本个数至少为1。
跨3个可用区:高可用部署模式,适用于具有更高可用性要求的生产型的工作,索引的副本个数至少为2。
注意:必须购买3个专有主节点。所选择的数据节点、冷数据节点及协调节点个数必须为可用区个数的整数倍。
切流与恢复:跨可用区实例部署完成后,如果发现实例中某一可用区中的节点出现问题,可通过切流操作,将来自客户端的流量只传输到剩余的在线状态的可用区中,并从集群中隔离被切流可用区中的节点。当被切流的可用区恢复正常后,可通过恢复操作,将来自客户端的流量传输到所有正常状态的可用区中,并在集群中重新加入被恢复的可用区中的节点。
在基本信息页面底部的节点可视化页签中,完成切流操作,确认后,集群会重启,重启成功后即可完成切流操作。切流成功后,被切流的可用区状态会从在线状态变为下线状态。
如果切流前,索引是有副本的,而切流后集群健康状态为非正常(黄色)。那么当确认完成切流后,您可以登录Kibana控制台,参考以下命令设置集群参数,使得被切流可用区中的分片分配到剩余的可用区中。分片分配完成后,集群的健康状态就会变为正常(绿色)。
PUT /_cluster/settings { "persistent" : { "cluster.routing.allocation.awareness.force.zone_id.values" : {"0": null, "1": null, "2": null} } }
如果想恢复,可以在节点可视化页签中,恢复被切流的可用区中的节点。操作提示对话框中,单击确认。确认后,集群会重启,重启成功后即可完成恢复操作。恢复成功后,被恢复的可用区状态会从下线状态变为在线状态。
《企业级云原生白皮书项目实战》——第五章 大数据——5.1 检索分析服务 Elasticsearch版——5.1.3 变更实例(6) https://developer.aliyun.com/article/1228892?groupCode=supportservice