开发者社区> 问答> 正文

可用性-可用探测点百分比告警

收到信息:
【阿里云】站点监控--taskName=wstx_com_https_bbs_wstx_com,address=https://bbs.wstx.com 12:15 发生告警,可用性-可用探测点百分比(66.67<95%)
请问这是什么情况?可用探测点百分比的影响因素都有哪些,如何才能提高可用探测点百分比到正常水平,谢谢!

展开
收起
1282798134129788 2018-08-30 14:15:59 4698 0
2 条回答
写回答
取消 提交回答
  • 无知人生,记录点滴。 不积跬步,无以至千里;不积小流,无以成江海 订阅号:微wx笑, 个人站点:https://www.ivu4e.cn/,https://www.ivu4e.com/ CSDN博客:https://blog.csdn.net/testcs_dn

    详细解答可以参考官方帮助文档

    高可用服务由Detection、Repair、Notice等模块组成,主要保障数据链路服务的可用性,以及负责处理数据库内部的异常。

    Detection

    Detection模块负责检测数据库引擎的主节点和备节点是否能正常提供服务。通过间隔为8~10秒的心跳信息,HA节点可以获得主节点的健康情况。结合备节点的健康情况和各HA节点的心跳信息,Detection模块可以排除网络抖动等异常引入的误判风险,在30秒内完成异常切换操作。

    Repair

    Repair模块负责维护数据库引擎的主节点和备节点之间的复制关系,以及修复主节点或者备节点在日常运行中出现的错误。例如:

    • 主备复制异常断开的自动修复
    • 主备节点表级别损坏的自动修复
    • 主备节点宕机的现场保存和自动修复

    Notice

    Notice模块负责将主备节点的状态变动通知到负载均衡或者Proxy,保证用户访问正确的节点。

    例如:Detection模块发现主节点异常,并通知Repair模块进行修复。Repair模块尝试后无法修复主节点,通知Notice模块进行流量切换。Notice模块将切换请求转发至负载均衡或者Proxy,此时用户流量全部指向备节点。与此同时,Repair模块在另一台物理服务器上重建新的备节点,并将变动同步给Detection模块。Detection模块开始重新检测实例的健康状态。

    2018-08-30 14:24:00
    赞同 展开评论 打赏
  • 阿里云大学导师
    您好,可能是部分地区运营商网络异常导致探测点无法到达目标服务器。多地域建立数据中心可以提高探测点百分比
    2018-08-30 14:18:15
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
网络流量异常行为分析系统 立即下载
基于流量的灰度发布和自动弹性实践 立即下载
《用管控策略设定多账号组织全局访问边界》 立即下载