《企业级云原生白皮书项目实战》——第五章 大数据——5.1 检索分析服务 Elasticsearch版——5.1.4 集群监控告警(4) https://developer.aliyun.com/article/1228836?groupCode=supportservice
日志告警
阿里云Elasticsearch日志高级告警的功能,告警依赖的数据是阿里云Elasticsearch的日志,告警能力主要使用的是Grafana 的告警能力,Grafana 的告警是仅仅当告警规则状态变化的时候,才会发出告警。Grafana 警报规则是依赖仪表板的,而仪表板依赖于Explore的Query查询结果数据。配置方式是先进入到日志监控页面,在日志监控页面进行配置,日志监控页面阿里云官网文档介绍较少,我这里给大家详
细说明下
Search
可以通过名字搜索dashboards(仪表板)。
create
创建dashboards(仪表板),可以手动创建panel(面板),也可以导入dashboards(仪表板)的json文件。
dashboards
主要功能是管理仪表板,可以选择具体某一个仪表板进行配置和编辑。
进入一个具体的dashboards,选择一个panel进行编辑,会有两个主要的配置项,分别是Query和Alert。
Query
Query就是Explore,支持的是Lucene Query。
Alert
Alert是告警配置
Rule
告警策略,Evaluate every为query的执行频率,for为告警持续时间,若for为0,命中规则后马上发出告警,否则持续设置的时间,超过设置的时间,将发送告警,如果警报规则已配置For并且查询满足了配置的阈值,则它将首先从OK到Pending。从OK到Pending状态,Grafana 不会发送任何通知。一旦警报规则触发超过For持续时间,它将更改为Alerting并发送警报通知。
另外,如果if no data or all values are null设置为No Data的情况,不要使用For,因为No Data是立即触发,不考虑FOR。如果设置了FOR,可能导致No Data -> Pending -> OK,不会发送OK状态的通知。
Conditions
告警条件
《企业级云原生白皮书项目实战》——第五章 大数据——5.1 检索分析服务 Elasticsearch版——5.1.4 集群监控告警(6) https://developer.aliyun.com/article/1228833?groupCode=supportservice