智能告警——企业IT系统神经中枢-阿里云开发者社区

开发者社区> 成喆> 正文

智能告警——企业IT系统神经中枢

简介: 本文记录阿里云SLS丁来强在2021阿里云开发者大会--基础设施的云上管控分论坛上的分享
+关注继续查看

image.png

人体的8种感觉

我们都知道人体神经系统非常复杂,由各个末梢信号后经由脊髓、大脑中枢处理后获得如下众所周知的5种感觉:

  • 视觉——眼睛、听觉——耳朵、触觉——皮肤、嗅觉——鼻、味觉——口

除此之外,人体其实还有另外3种重要的感觉,分别是:

  • 内脏觉——内脏、本体觉——关节肌肉、前庭觉——前庭神经核


其中内脏觉获取来内脏壁信号,产生内脏相关的感觉例如饥饿、饱腹、尿急等。本体觉获取关节肌肉等信号,感知当前身体处于一个什么样的姿势和运动状态。前庭觉则通过各方信号,获得平衡方向感,并过滤信号以便集中精神。

不用说,任何一个感觉出了问题,都会造成非常严重的后果。人们健康快乐的生活离不开这些神经系统的正常工作。


企业IT系统的感觉系统

企业IT系统同样存在各种感觉——对计算、网络、存储、安全、管控等系统的监控运维。数字化信息化的今天,企业组织能否健康、稳定、持续的发展也离不开其IT系统的神经系统——监控运维系统(更宽泛的说法叫可观测性系统)的正常工作。

但不同于人类物种经过几百万年的统一演化为基本一致性,企业IT系统的告警监控系统(可观测性系统),还存在非常大的多样性,例如如下使用开源方式对容器化部署形态的IT系统的监控存在多种方案组成:

image.png


传统告警系统大量碎片化、无体系的神经孤岛,带来了非常多的痛点,包括重复建设、监控智能差、告警风暴、触发不人性化、无法闭环等。

image.png


SLS告警为企业IT系统提供智能神经中枢

作为新一代的云原生可观测平台,SLS支持多种数据源的一体化接入、一站式的存储、加工、分析、可视化、监控、投递、三方对接,为企业IT系统的使用者(包括开发运维、监控人员、商务、安全运营人员等)提供了最快、最高效的观测体验。

image.png

作为SLS的一个子系统,SLS告警为IT系统重现构建了智能神经中枢。

image.png


目前已经大量被阿里云平台的企业用户使用,每天从海量的数据中监控识别产生告警、管理处理并通知与响应,可证明的灵活适配与稳定可靠性。

image.png


使用SLS告警可以给企业IT系统的神经中枢提升易用弹性、可靠性以及功能灵活性,并降低成本、告警噪音以及减少损失。

image.png

下面从几个侧面了解一下SLS告警是如何为企业IT系统提供智能的神经中枢的。

接入三方告警——兼听则明

类似于人体的多种感觉从多方获取信号设置告警(例如听到天气预报说明天会下大雨,而出门带好雨伞),SLS告警也支持从其他多种流行监控系统中直接接受告警,并进行智能处理与响应。支持的三方系统包括Promethues告警、Grafana告警、Zabbix告警等。

image.png


统一信号分析——智能告警监控

SLS作为可观测平台,已经接收了IT系统的大量信号(日志、时序、跟踪等),可以直接使用SLS告警从中挖掘出大量信息(告警),SLS提供了一套查询分析语法,全面覆盖现在流行的时序、分析型语法,兼顾强大灵活与易上手。

image.png

不仅如此,还支持多种数据的协同关联,就像闭上眼睛,拿一个水果,也可以通过触觉、嗅觉、听觉等判断出这是一个杯子、还是一个苹果等。

image.png

智慧信号处理——ML算法

就像人的脊髓、大脑等会自动参与信号处理得到更高级的感觉信息一样,从海量的数据中产生信息包括告警,离不开机器学习的支持,SLS提供多种丰富流行与顶级算法,更精准高效的产生告警。

image.png

千里眼——全局监控

人的感觉系统是有距离限制的,触觉限制了手能够到的地方,视觉可达数公里。但IT企业系统可能分布在各个国家、城市系统或各个隔离的账号体系中,SLS告警支持跨库、跨地域、跨账号的对数据进行远程监控,就像千里眼一样。

image.png

知识库——内置规则库

人类善于学习积累来扩展感觉系统,一个小朋友在摸过看过或碰触装了热水的玻璃杯后会记住这个感觉,下次再看到冒着热水的玻璃杯就会得到一样的信息。SLS告警的内置告警规则库,提供数百个这样的知识,开箱机用。

image.png

告警降噪——IT系统的前庭觉

一个男生在玩《王者荣耀》时,或一个新青年在看《光荣与梦想》时,通常会自动忽略周围的大部分信息,这其实是前庭觉在起作用。在企业监控告警中,也需要通用的机制:在收到一个主机宕机的严重告警时,IT运维同学加紧迁移系统中,希望自动忽略该主机上一连串的其他告警的。亦或者在晚上休息期间,非严重告警,要被自动忽略掉。SLS告警的管理功能(告警策略、行动策略等),可以提供静默、合并、合并降噪等功能,也支持根据节假日、工作时段等灵活调整通知策略等。

image.png

告警态势大盘——IT系统的本体觉

类似于本体觉让你闭上眼睛也能感知自己是站着还是躺着,处于什么姿势一样。SLS告警的多张告警大盘让使用者轻松掌握目前整体告警态势与进展。

image.png

记事本——事务管理

人的神经系统不能一下次并行处理多个事务(例如很难一边写作业、一边玩游戏),也不容易记住很多事情。IT系统运维人员面对许多并行告警时,同样如此,SLS的告警事务管理提供了这样的便利,就像记事本一样帮助他们管理好各个告警的状态,及时有效的跟进或处理。image.png

神经系统响应——行动管理

一如人体对于感觉会做出反应(如看到危险,要躲避一样),SLS告警提供多种通知与响应形式,包括各种渠道:

image.png

也企业组织下还支持贴心的功能如:值班表(轮岗代班等)、告警升级等。

image.png

进一步参考

image.png

  • 更多SLS的系列直播与培训视频会同步到微信公众号与B站,敬请留意

image.png


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10095 0
谈谈对于企业级系统架构的理解
转自:http://www.cnblogs.com/liping13599168/archive/2011/05/11/2043127.html 在我们刚开始学习架构的时候,首先会想到分层的概念,分层架构比较经典的是三层架构,那么,什么是三层架构呢?它包括表现层,业务层,数据访问层;而对于一个新手来说,从抽象意义上的三层架构,逻辑上就划分为三个层。
855 0
工业和信息化部印发《关于有序推动工业通信业企业复工复产的指导意见》
近期,工业和信息化部联合印发了《关于有序推动工业通信业企业复工复产的指导意见》
296 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
12078 0
安装规划企业邮件系统
楔子 好久没有玩windows了今天耍耍邮件吧! 简介 1、功能介绍 exchange 2010 通过数据库的方式组织邮箱,取代了2007的存储组。 exchange 2010 相对于 2007  大幅度减少了对磁盘的I/O的使用率,比2007 减少了至少50%~70%  2010可以支持更大的存储。
1238 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13893 0
Asp.net MVC 3 开发简单的企业系统开篇--数据库
本来准备自己做一个单独的系统(Asp.net MVC 3 开发一个简单的企业网站系统)玩一玩,没想到引来了大家的关注,令我非常激动啊,在这里非常感谢支持鼓励我的朋友们、园友们,谢谢您们。 虽然是要做一个简单的网站系统来练习一个主流的框架的使用,好让我自己更加熟悉自己的缺陷,看到大家的热情。
722 0
+关注
成喆
不忘初心 方得始终
101
文章
2
问答
来源圈子
更多
阿里云存储基于飞天盘古2.0分布式存储系统,产品包括对象存储OSS、块存储Block Storage、共享文件存储NAS、表格存储、日志存储与分析、归档存储及混合云存储等,充分满足用户数据存储和迁移上云需求,连续三年跻身全球云存储魔力象限四强。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载