对于时间序列数据来说,t 时刻的数值对于 t-1 时刻的数值有很强的依赖性。例如, 某个游乐园的人在 8:00 这一时刻很多,在 8:01 时刻其人很多的概率是很大的;但如果 其在 7:01 时刻的人较多,这对于其在 8:01 时刻人数的多少影响不是很大。 针对最近时间窗口内的数据遵循某种趋势的现象,可以使用一条曲线对该趋势进行 拟合。如果新的数据打破了这种趋势,使曲线变得不平滑,则该点就出现了异常。曲线拟合的方法有很多,如回归、滑动平均等。本书用 EWMA,即指数权重移动平 均方法来拟合曲线。有了平均值之后,就可以使用 3-σ理论来判断新的输入是否超过了容忍范围。根据 实际的值是否超出了容忍范围就可以知道是否可以告警:若超出了上界,可能是流量突 然增加了;若低于下界,可能是流量突然降低了,这两种情况都需要告警。可以使用 Pandas 库中的 ewma 函数来实现上面的计算过程。以上内容摘自《应用智能运维实践(试读版)》电子书,点击https://developer.aliyun.com/ebook/download/367 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。