案例23-服务出现频繁掉线情况

简介: 服务出现频繁掉线情况

一、背景介绍

       在springCloud项目中,通过使用nacos来对服务进行管理。但是其中一个服务总会出现频繁掉线的情况。通过查看错误日志报500

1e206704899a465284b2dffe6943c271.png

通过查阅博客进行解决:先把服务停掉,再停nacos,再删除data目录下的protocol文件夹,最后重启需要注册的服务就可以了。

cab8c31ceb4e43caa95eec7a5f449acb.png

d95aca82e84b45fea90ecb53e065175f.png

二、分析原因

1.nacos中data文件的作用

       nacos的data文件是用来存储nacos服务的数据的,包括配置信息,服务信息等。默认的情况下,data文件位于naocs安装目录下的。

ecb78ac8ca804269b13b7fc96b9012c6.png

2. data路径下protocol文件的作用

       nacos的data目录下的protocol目录是用来存储。服务中心的协议信息的,它记录了服务注册中心所使用的协议类型,版本号等等。以便于服务提供者和服务消费者之间进行通信。

3.nacos ip混乱的问题

       nacos的ip混乱。可能是因为网络配置不正确,或者服务注册不规范导致的。可以通过检查网络配置和服务注册情况来解决这个问题。我们这里使用的解决问题是注册的服务全部删掉,然后重新注册解决的。

三、Naocs服务注册和发现

服务注册

       nacos 服务注册中心,它是服务,其实例及元数据的数据库。服务实例在启动时注册到服务注册表,并在关闭时注销。服务和路由器的客户端查询服务注册表以查找服务的可用实例。服务注册中心可能会调用服务实例的健康检查 API 来验证它是否能够处理请求。

服务发现

       各服务实例会上报自己的网络地址,这样服务中心就形成了一个完整的服务注册表,各服务实例会通过服务发现中心来获取访问目标服务的网络地址,从而实现服务发现的机制。同时会在Nacos Client 本地开启一个定时任务,定时拉取服务端最新注册表信息,更新到本地缓存。


相关文章
|
12月前
|
存储 Nacos 微服务
【项目实战典型案例】23.部分服务总是频繁出现掉线情况
【项目实战典型案例】23.部分服务总是频繁出现掉线情况
|
2月前
|
Oracle 数据库 UED
后台查询接口影响响应时间最大的因素:用空间换时间的优缺点及解决方案
1.当数据库的一个表记录很多显然查询数据很慢。 2.当数据库的一个表记录不大,但是数据很大也可能很慢。 我们的一个用户表中一个building很大,当查询100条数据就会把服务器的内存搞爆掉。 当然查询时要查询筛选有用字段,不可以直接把记录的所有字段都查拆来。这样能减少内存消耗和提高查询速度。 3.在经常查询字段上建立索引。据说oracle上用索查询和不用索引查询在超多记录的情况下相差1000倍。 4.若出现嵌套查询显然会大大增加相应查询时间。要先预处理用管道操作把能合并的查询合并到一个查询中,然后生成map,然后再处理。这是标准的用空间换时间的方案。
66 8
|
7月前
|
前端开发 Cloud Native 大数据
坑爹,线上同步近 3w 个用户导致链路阻塞引入发的线上问题,你经历过吗?
坑爹,线上同步近 3w 个用户导致链路阻塞引入发的线上问题,你经历过吗?
|
安全 关系型数据库 MySQL
为什么延迟复制适用于备库数据的紧急恢复?底层原理是什么?
为什么延迟复制适用于备库数据的紧急恢复?底层原理是什么?
|
负载均衡 算法 Java
记一次线上频繁FGC的事件和解决方式
1.大量的请求,调用的地方要注意是否会导致内存的大量消耗,尽可能使用池化技术,单例等,减少创建,销毁的系统开销;2.CMS 的几个缺点,可以参考《深入java虚拟机》,对CPU占用会比较高,无法处理浮动垃圾,还有就是CMS使用的是标记-清除算法,会导致大量的空间碎片,碎片过多的话,导致分配大对象很困难,所以不得不进行FGC,也可能是这个原因导致了本文说的一直FGC的问题。
340 0
记一次线上频繁FGC的事件和解决方式
|
存储 运维 算法
CPU静默数据错误:存储系统数据不丢不错的设计思考
对于数据存储系统来说,保障数据不丢不错是底线,也是数据存储系统最难的部分。据统计,丢失数据中心10天的企业,93%会在1年内破产。那么如果想要做到数据不丢不错,我们可以采取怎样的措施呢?
CPU静默数据错误:存储系统数据不丢不错的设计思考
|
安全 Linux Windows
服务器经常出现CPU爆满情况,该如何处理呢?
服务器经常出现CPU爆满情况,该如何处理呢? 对于服务器来说,CPU就是它的核心所在,不管我们处理任何任务都需要CPU来完成,一旦CPU出现爆满,那么我们的服务器就会出现卡顿甚至是死机无法连接等情况,那么如果我们的服务器经常出现CPU爆满情况,该如何处理呢?一、确认CPU爆满的原因 如果我们远程到香港服务器中,发现操作比较卡时,可以检查下CPU使用是否正常,如果是windows系统,那么我们可以通过任务管理里的性能来查看或者可以通过一些安全软件来进行查看,如果是linux系统,那么可以命令来进行查看,或者可以通过安装的一些软件查看,比如安装宝塔软件等。
一次性搞清楚线上CPU100%,频繁FullGC排查套路
“ 处理过线上问题的同学基本上都会遇到系统突然运行缓慢,CPU 100%,以及 Full GC 次数过多的问题。 当然,这些问题最终导致的直观现象就是系统运行缓慢,并且有大量的报警。 本文主要针对系统运行缓慢这一问题,提供该问题的排查思路,从而定位出问题的代码点,进而提供解决该问题的思路。
2323 0
|
弹性计算 容灾 大数据
黑科技揭秘:阿里云如何做到从业务宕机到恢复业务运行只用一分半钟时间
企业关键业务宕机会带来非常大的损失,而传统的自建容灾方案成本高昂运维复杂,因此高性能的云容灾服务正在成为企业业务持续性保障的优先选择。混合云容灾服务(HDR)-关键业务型的演示完整呈现了将本地服务器上运行的报账系统实时容灾复制到阿里云,并在出现宕机后在云上快速拉起恢复业务的全过程。
3263 0