Mocha BSM产品亮点——事件管理-阿里云开发者社区

开发者社区> 开发与运维> 正文

Mocha BSM产品亮点——事件管理

简介:
业务需求与挑战
随着IT基础架构的不断扩充,网络、系统和应用也在向超出管理员的控制范围,运维中的问题也越来越多,一旦企业某些资源出现问题,需要即时掌握以下:
• 哪些资源发生的什么问题?
• 根本原因是什么?有没有相关联的事件?
• 事件太多,有没有过滤
• 如何从众多的问题中,找到最优先要处理的事件?
 
关键功能与亮点
• 提供根本原因分析,快速发现故障根源,缩短恢复事件,最大挽救经济损失
        比如:以下的核心设备出现故障后,将会引发连锁反应,导致其他的应用或者主机全部都不可访问,而这个时候,管理人员看到的将是大量的故障事件。管理人员,很难迅速从这样大量的事件中,发现真正的故障根源。
        现在,通过Mocha BSM的根本原因分析,就可以快速的分析出罪魁祸首,帮助管理人员在第一时间,将核心设备的故障进行恢复,而后其他应用和主机系统将不治自愈,降低企业的经济损失。
product-ld-2.jpg

• 提供Flapping技术,减少误报事件,提高工作效率
        虽然很多管理软件提供了策略机制,管理人员可以通过设置设备监控的告警阈值,一旦设备指标超过了规定的阈值,才会产生告警事件。然而,在监控的过程当中,设备时常会因为偶然的波动,在超过规定的阈值后,迅速的恢复正常状态。这种“昙花一现”的现象不值得关注,但是往往会给IT管理员误报,耽误了管理人员的宝贵时间。
product-ld-3.jpg

       现在我们通过Flapping技术,设置一个确认数值。比如我们设置了一个 Flapping=3的数值,一旦在一个时间段内,连续超过严重阈值3次,系统就会发事件和发报警,避免了无谓的误报。
• 事件关联
        如果没有事件关联的功能,如果一台设备出现问题,相关的事件将会撒落在事件管理的各处,就如右图所示:
通过关联事件功能,系统会把相关的事件组织在一起,达到:
       - 一条事件
       - 一条报警
       - 一个列表展现
product-ld-4.jpg
 
我们给客户带来什么
• 帮助企业提高工作效率 
       事件发生时通过事件过滤,事件压缩,事件根本原因分析等方式帮助管理人员准确定位故障,及时处理问题,提高工作效率。
• 快速定位问题,快速响应,降低影响
       企业中的资源一旦出现问题,可以帮助管理人员分析发生事件的根本原因及关联指标事件。帮助管理人员准确定位问题,向相关人员发送报警,及时处理问题,避免问题扩大化。
• 帮助管理人员建立故障优先处理级别
       如果管理人员收到了多个资源问题的故障单,如果事先没有对资源事件级别进行设定,管理人员会按照先到先解决的原则进行排除,Mocha BSM能够帮助管理人员建立优先级别,通过级别的展现,管理人员可以很清楚的了解到眼下首先要做的是什么。
• 规范化事件处理流程
       事件触发流程,提供灵活的、规范化的IT系统管理,用结构化、流程化的支持机制,加强员工的条理性。
 
更多相关信息,请点击[url]http://www.mochabsm.com[/url]




本文转自赖永锋51CTO博客,原文链接:http://blog.51cto.com/mochasoft/86393,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章