系列目录:
- Spring Cloud Eureka 全解 (1) - 总览篇
- Spring Cloud Eureka 全解 (2) - 整体流程篇
- Spring Cloud Eureka 全解 (3) - 核心流程-服务注册与取消详解
- Spring Cloud Eureka 全解 (4) - 核心流程-服务与实例列表获取详解
- Spring Cloud Eureka 全解 (5) - 自我保护机制
- Spring Cloud Eureka 全解 (6) - 一些热门QA
- Spring Cloud Eureka 全解 (7) - 生产配置最佳实践
- Spring Cloud Eureka 全解 (8) - 安全配置
自我保护机制
关闭自我保护机制(默认是打开的):eureka.server.enable-self-preservation=false
自我保护机制:默认情况下,如果Eureka Server在一定时间内没有接收到某个微服务实例的心跳,Eureka Server将会注销该实例(默认90秒)。但是当网络分区故障发生时,微服务与Eureka Server之间无法正常通信,以上行为可能变得非常危险了——因为微服务本身其实是健康的,此时本不应该注销这个微服务。
Eureka通过“自我保护模式”来解决这个问题——当Eureka Server节点在短时间内丢失过多客户端时(可能发生了网络分区故障),那么这个节点就会进入自我保护模式。一旦进入该模式,Eureka Server就会保护服务注册表中的信息,不再删除服务注册表中的数据(也就是不会注销任何微服务)。当网络故障恢复后,该Eureka Server节点会自动退出自我保护模式。
综上,自我保护模式是一种应对网络异常的安全保护措施。它的架构哲学是宁可同时保留所有微服务(健康的微服务和不健康的微服务都会保留),也不盲目注销任何健康的微服务。使用自我保护模式,可以让Eureka集群更加的健壮、稳定。
但是,在我们实际生产中,我们云环境同一个Region下不会发生大规模网络分区状况,所以没有启用自我保护。
相关参数:eureka.server.renewalPercentThreshold = 0.85
整体逻辑
在每一个服务实例注册时:
expectedNumberOfRenewsPerMin += 2 numberOfRenewsPerMinThreshold = RenewalPercentThreshold*numberOfRenewsPerMinThreshold
无论你设置心跳时间是多少,expectedNumberOfRenewsPerMin都是+2(默认心跳时间是30s,每分钟有60s,所以+2,但是没有根据真正的心跳时间修改,应该算是个缺陷)
在收到心跳时:
renewsLastMin.increment()
当renewsLastMin<numberOfRenewsPerMinThreshold
,就会触发自我保护,不会失效过期服务