MSE微服务引擎怎么没有看到健康服务实例数的监控,现在服务异常了不可用都监控不到?

MSE微服务引擎怎么没有看到健康服务实例数的监控,现在服务异常了不可用都监控不到?

展开
收起
真的很搞笑 2024-02-25 08:11:35 55 分享 版权
阿里云 AI 助理回答

在使用阿里云微服务引擎(MSE)时,如果您发现无法监控到健康服务实例数,可能是由于配置或监控指标未正确设置导致的。以下是详细的排查和解决方法:


1. 确认健康检查配置是否正确

健康检查是确保服务实例可用性的重要手段。如果健康检查未正确配置,可能导致无法准确监控健康服务实例数。

  • 操作步骤

    1. 登录MSE网关管理控制台,并选择目标地域。
    2. 在左侧导航栏中,依次选择云原生网关 > 网关列表,单击目标网关名称。
    3. 进入路由管理 > 服务页面,找到对应服务并单击其健康检查配置
    4. 确保开启健康检查开关已打开,并根据实际需求配置TCP或HTTP健康检查参数。
  • 注意事项

    • 如果使用的是TCP健康检查,请确认目标节点是否可以正常建立连接。
    • 如果使用的是HTTP健康检查,请确保健康检查路径配置正确,并可通过工具(如curl或Postman)验证路径是否可访问。

2. 检查服务实例的注册与发现状态

服务实例的注册与发现状态直接影响健康实例数的监控。如果实例未正确注册或被隔离,可能导致监控数据异常。

  • 操作步骤

    1. 登录MSE注册配置中心管理控制台,并选择目标地域。
    2. 在左侧导航栏中,选择注册配置中心 > 实例列表,单击目标实例名称。
    3. 查看服务实例的注册状态,确认是否存在异常实例(如离线或隔离状态)。
    4. 如果存在异常实例,结合服务实例隔离与诊断功能,分析实例是否因内存泄漏等问题被隔离。
  • 重要提醒

    • 推空保护功能可能会影响服务实例的可用性感知。如果开启了推空保护,客户端可能会从缓存中获取上一次正常的服务端地址,从而掩盖了部分异常情况。
    • 确保服务提供者的实例未被离群实例摘除功能移除。该功能会在实例异常时将其从负载均衡池中移除,以保障请求转发到正常实例上。

3. 查看监控大盘中的相关指标

MSE提供了丰富的监控能力,您可以通过Grafana监控大盘或旧版监控页面查看服务实例的健康状态。

  • 操作步骤

    1. 登录MSE注册配置中心管理控制台,并选择目标地域。
    2. 在左侧导航栏中,选择观测分析 > 监控,查看服务实例的健康状态。
    3. 如果使用的是新版Grafana监控大盘,单击资源监控页签,查看入口流量出口流量CPU使用率等指标。
    4. 如果使用的是旧版监控页面,查看服务数服务提供者数服务写接口的平均请求耗时等数据。
  • 注意事项

    • 默认监控周期为当前时间之前的30分钟。您可以调整时间范围,确保覆盖异常时间段。
    • 如果监控数据中未显示健康实例数,可能是因为服务实例未正确注册或健康检查未通过。

4. 排查网络连通性问题

网络连通性问题可能导致服务实例无法被正确监控。

  • 排查步骤
    1. 确认网关VPC与服务实例所处VPC是否一致,或是否通过云企业网、专线打通。
    2. 检查安全组授权是否正确配置,尤其是ACK服务来源的安全组规则。
    3. 如果服务实例使用公网地址,确认网关所在VPC是否开启了公网NAT网关。

5. 升级Nacos引擎版本

如果您使用的是Nacos引擎,建议升级到最新版本以获得更稳定的监控能力。

  • 操作步骤

    1. 登录MSE注册配置中心管理控制台,并选择目标地域。
    2. 在左侧导航栏中,选择实例列表,找到目标Nacos实例。
    3. 单击升级版本,选择最新的专业版或开发版进行升级。
  • 优化点

    • 最新版本优化了推送成功率监控逻辑,避免因推空保护导致的监控数据异常。
    • 支持更多限流功能,提升引擎稳定性。

6. 启用服务治理可观测能力

如果上述方法仍无法解决问题,建议启用服务治理的可观测能力,进一步分析服务实例的运行状态。

  • 操作步骤
    1. 在MSE控制台中,启用服务治理可观测功能。
    2. 查看近五分钟内的实时QPS、RT、CPU、Load等监控数据,定位异常实例的具体问题。

总结

通过以上步骤,您可以逐步排查并解决MSE微服务引擎中健康服务实例数监控异常的问题。如果问题仍未解决,建议联系阿里云技术支持团队,提供详细的日志和配置信息以便进一步分析。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

为微服务建设降本增效,为微服务落地保驾护航。

还有其他疑问?
咨询AI助理