改了 Nacos 一行配置,搞崩线上支付系统!

本文涉及的产品
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
简介: Nacos服务注册默认使用临时实例,通过心跳机制实时感知服务状态,适合支付、订单等动态业务。持久化实例由服务端探活,适用于MySQL、Redis等静态组件。配置中心所有配置均持久化,无“临时”概念,动态更新指内容变更而非生命周期短暂。正确理解差异,避免因`ephemeral=false`误配导致生产事故。

节前上线出问题,线上灰度发布后部分用户反馈付款后订单状态不更新,支付服务的失败率飙升。一顿排查后发现致命配置错误。小可爱上线时,将payment-service服务的 Nacos 注册类型改成了ephemeral=false(持久化实例)。

当时其中一台服务节点因内存泄漏频繁 GC,心跳线程被阻塞超过 30 秒,但是由于持久化实例没被 Nacos 剔除,导致调用方持续往这台异常节点发请求,最终拖垮整个支付链路。

这个面试场景题总问,不过很多同学对 Nacos 临时、持久实例的认知,只停留在服务会不会消失的表面,什么时候该用临时,什么时候该用持久,适用场景是什么,没太明白。

注册中心和配置中心本质区别

我们用 Nacos 主要使用到它的服务注册中心和配置中心,它们的设计初衷不同,服务注册中心要求符合 CAP 中的高可用(AP)服务发现不能中断,允许短暂数据不一致;注册中心要求是一致性(CP),配置不能错、不能丢,更新需同步到所有节点。

简单说,注册中心的实例是活的服务节点,配置中心的实例是死的配置文件

它们之间的实例的概念也不太一样:

对比维度 服务注册中心的实例 配置中心的实例
本质 运行中的服务节点(如user-service的某台服务器) 静态配置数据单元(如redis-dev.yml配置文件)
核心作用 提供服务发现,让调用方找到可用节点 集中管理配置,支持动态更新
创建方式 客户端自动注册(如 Spring Cloud 服务启动时) 手动创建(控制台 / API)或代码推送
生命周期依赖 依赖服务节点的运行状态(节点宕机则实例失效) 依赖手动维护(不删就一直存在)

注册中心:默认临时实例

要知道服务注册中心的核心需求是实时感知服务可用性

它设计了临时实例持久化实例两种模式,分别对应动态服务和静态服务场景。

临时实例

临时实例是 Nacos 服务注册的默认模式

Spring Cloud、Dubbo 等业务服务启动时,若不额外配置,都会以临时实例注册。核心逻辑是心跳保活,来检测服务的可用性。

  • 心跳机制:客户端每 5 秒向 Nacos 服务端发送一次心跳;服务端 15 秒没收到心跳,就把实例标记为不健康;30 秒没收到,直接从注册表中剔除实例;

  • 存储方式:实例信息只存在服务端内存中,不写磁盘。Nacos 重启后,所有临时实例都会消失,需客户端重新注册;

  • 故障表现:服务节点宕机、网络中断,或像我们支付服务那样因 GC 阻塞心跳,实例会被自动摘除,调用方不会再路由到无效节点。

持久化实例

持久化实例则完全相反,它针对长期稳定运行、很少变化的基础服务(如 MySQL、Redis、Elasticsearch)设计,核心逻辑是服务端主动探活 + 数据持久化,不适合支付、订单这类动态业务服务。

  • 保活机制:不需要客户端发心跳,而是 Nacos 服务端主动探活。支持 TCP 端口探测(如 MySQL 的 3306 端口)、HTTP 接口探测(如 Redis 的 /health 接口)、自定义协议探测;

  • 存储方式:实例信息会持久化到 Nacos 的数据库(默认 Derby,生产用 MySQL),即使 Nacos 重启,实例信息也不会丢失;

  • 故障表现:实例宕机后,Nacos 只会把它标记为不健康,不会删除。运维能在控制台实时看到故障节点,方便排查,恢复后实例自动变回健康。

在 SpringCloud 项目中,只需在application.yml中添加一行配置,就能切换实例类型,就是这行配置,被新人改错导致了故障:

spring:
   cloud:
     nacos:
       discovery:
          server-addr: 192.168.1.100:8848
          ephemeral: false # 新人误改为此值,正确应为true(默认)
          service: payment-service # 注册的服务名

配置中心:默认持久化

Nacos 配置中心的所有配置实例(即配置文件)默认都是持久化的,根本不存在临时配置的概念,所谓的动态更新也和临时无关。

Nacos 配置中心的设计初衷是集中管理配置,避免配置丢失,因此所有配置都满足以下特性:

  • 存储层面:无论在控制台创建、还是用 API 推送的配置,都会持久化到数据库(如 MySQL),即使 Nacos 服务端重启、甚至服务器宕机,配置也不会丢失;

  • 生命周期:配置只会被手动删除或覆盖更新,不会因为客户端断开连接、或服务重启而自动消失;

  • 动态更新:客户端通过长轮询机制监听配置变化(默认每 30 秒轮询一次,可调整),配置更新后 1 秒内推送到客户端。但动态更新是 内容实时变化,不是配置临时存在。

写在最后

说了一大堆其实总结起来就两句话:

  • 服务注册中心:动态业务服务(支付、订单)用临时实例(默认),静态基础组件(MySQL、Redis)用持久化实例;

  • 配置中心:没有临时配置,所有配置默认持久化,动态更新 ≠ 临时存在。

读到这就等于学会!

相关文章
|
1月前
|
算法 Java 微服务
【SpringCloud(1)】初识微服务架构:创建一个简单的微服务;java与Spring与微服务;初入RestTemplate
微服务架构是What?? 微服务架构是一种架构模式,它提出将单一应用程序划分为一组小的服务,服务之间互相协调、互相配合,为用户提供最终价值。 每个服务允许在其独立的进程中,服务于服务间采用轻量级的通信机制互相协作(通常是Http协议的RESTful API或RPC协议)。 每个服务都围绕着具体业务进行构建,并且能够被独立的部署到生产环境、类生产环境等。另外应当尽量避免统一的、集中式的服务管理机制,对具体的一个服务而言,应根据上下文,选择合适的语言、工具对其进行构建
416 126
|
1月前
|
负载均衡 算法 Java
【SpringCloud(4)】OpenFeign客户端:OpenFeign服务绑定;调用服务接口;Feign和OpenFeign
Feign是一个WebService客户端。使用Feign能让编写WebService客户端更加简单。 它的使用方法是定义一个服务接口然后再上面添加注解。Feign也支持可拔插式的编码器和解码器。SpringCloud对Feign进行了封装,十七支持了SpringMVC标准注解和HttpMessageConverters。 Feign可用于Eureka和Ribbon组合使用以支持负载均衡
610 138
|
1月前
|
JavaScript Java 关系型数据库
基于springboot的古树名木保护管理系统
本研究针对古树保护面临的严峻挑战,构建基于Java、Vue、MySQL与Spring Boot技术的信息化管理系统,实现古树资源的动态监测、数据管理与科学保护,推动生态、文化与经济可持续发展。
|
1月前
|
负载均衡 算法 Java
【SpringCloud(3)】Ribbon负载均衡:IRule原理轮询算法;LB负载均衡;loadbalancer和IRule组件;Ribbon和Ngin负载均衡的区别
Spring Cloud Ribbon 是基于Netflix Ribbon实现的一套客户端的负载均衡工具 简单地说,Ribbon是Netflix发布的开源项目,主要功能是提供客户端的软件负载均衡算法和服务调用。Ribbon客户端组件提供一系列完善的配置项如连接超时、重试等。就在在配置文件中列出Load Balancer(LB)后面所有的机器,Ribbon会自动的帮助你基于某种规则(如简单轮询,随机链接等)去连接这些机器。我们很容易使用Ribbon实现自定义的负载均衡算法
336 136
|
1月前
|
Web App开发 缓存 监控
内存溢出与内存泄漏:解析与解决方案
本文深入解析内存溢出与内存泄漏的区别及成因,结合Java代码示例展示典型问题场景,剖析静态集合滥用、资源未释放等常见原因,并提供使用分析工具、优化内存配置、分批处理数据等实用解决方案,助力提升程序稳定性与性能。
560 1
|
1月前
|
负载均衡 算法 Java
【SpringCloud(2)】微服务注册中心:Eureka、Zookeeper;CAP分析;服务注册与服务发现;单机/集群部署Eureka;连接注册中心
1. 什么是服务治理? SpringCloud封装了Netfix开发的Eureka模块来实现服务治理 在传统pc的远程调用框架中,管理每个服务与服务之间依赖关系比较复杂,管理比较复杂,所以需要使用服务治理,管理服务于服务之间依赖关系,可以实现服务调用、负载均衡、容错等,实现服务发现与注册
202 1
|
1月前
|
人工智能 安全 Java
分布式 Multi Agent 安全高可用探索与实践
在人工智能加速发展的今天,AI Agent 正在成为推动“人工智能+”战略落地的核心引擎。无论是技术趋势还是政策导向,都预示着一场深刻的变革正在发生。如果你也在探索 Agent 的应用场景,欢迎关注 AgentScope 项目,或尝试使用阿里云 MSE + Higress + Nacos 构建属于你的 AI 原生应用。一起,走进智能体的新世界。
409 36
|
1月前
|
Java 虚拟化 容器
(Java)Java里JFrame窗体的基本操作(容器布局篇-1)
容器 容器,我的理解是可以包容其他东西的玩意。它可以是一个盒子,可以是一个虚拟化的物品,可只要能包裹住其他存在质体的东西,那么都可以称作是容器。例如:JPanel组件和JScollPane组件两者都是容器也是组件。 既然有容器,那么容器中的布局就必不可少了。不然不规矩的摆放物品,人类看不习惯,我也看不习惯 ???? 本篇内容,将说明java JFrame窗体里容器中几类布局。 说明:所有在JFrame窗体里的容器布局都会使用setLayout()方法,采用的布局参数都将放进这个方法里 绝对布局 调用窗体容器
76 1