开发者社区 > 云原生 > 正文

"Nacos中集群有两台报连不到,怎么排查原因?

"Nacos中集群有两台报连不到,com.alibaba.nacos.api.exception.NacosException: ip: 10.211.12.66:8848 is not in serverlist,telnet三台机器都是通的 排除网络问题
8db4e780bc094f63c25ceffeb749e12e.png
650e7d746e4be6a704ba200a7d29ef3c.png
c1d0e98e1a2411bd618948594e7f93e5.png
cluster配置是这样的 ,还能从哪些方面去排查这个问题?"

展开
收起
十一0204 2023-07-19 21:12:28 102 0
1 条回答
写回答
取消 提交回答
  • 如果在 Nacos 集群中有两台机器无法连接,并且在客户端出现 "ip: 10.211.12.66:8848 is not in serverlist" 错误,但通过 Telnet 可以连接到这两台机器,那么可以考虑以下几个可能的原因和解决方法:

    1. 配置问题:检查 Nacos 集群中所有节点的配置文件,确保它们在 cluster.confapplication.properties 中正确列出了集群中的所有节点。确保所有节点都能够互相发现和加入集群。

    2. 主机名解析问题:确认这两台机器的主机名或 IP 地址是否正确解析。可以尝试在这两台机器上执行 nslookup 命令来验证主机名解析是否正常。

    3. 防火墙或安全组策略:排除防火墙或安全组策略导致的网络连接问题。确保防火墙或安全组策略允许 Nacos 节点之间的通信流量。

    4. 端口占用问题:确认这两台机器上的 8848 端口没有被其他进程占用。可以使用 netstat -tuln | grep 8848 命令来检查端口占用情况。

    5. 版本兼容性问题:确保这两台机器上运行的 Nacos 版本与其他节点的版本一致,或者至少是兼容的。不同版本之间可能存在集群通信的兼容性问题。

    如果仍然无法解决问题,可以尝试以下步骤进行故障排除:

    • 检查这两台机器的 Nacos 日志文件,查看是否有任何异常或错误信息。
    • 在客户端代码中,尝试使用固定的服务器地址而不是自动发现模式,以确保连接到这两台机器。
    • 尝试重新启动这两台机器上的 Nacos 进程,以确保其正常启动并加入集群。
    2023-07-28 12:06:24
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

相关电子书

更多
Nacos架构&原理 立即下载
workshop专场-微服务专场-开发者动手实践营-微服务-使用Nacos进行服务的动态发现和流量调度 立即下载
Nacos 启航,发布第一个版本, 云原生时代助力用户微服务平台建设 立即下载