zabbix使用IT services 了解服务器SLA整体情况

简介:

什么是IT Services


服务器或者某项服务、业务的可用率,不懂技术的上级领导会过问最近服务器可用率如何、所有api的状况怎么样?通常一些技术人员会说负载怎么样,哪些cpu使用率怎么样,硬盘使用情况,api的响应速度都保持在多少、响应时间都在多少?还没等说完,领导就打断了。他不关心这些细节,更不懂这些技术。他想要的是一个结果。比如说服务器故障率在0.001,api的响应率在99.99%。这就是IT Services的功能。

IT service结构如下:


IT Service

|

|-Workstations

| |

| |-Workstation1

| |

| |-Workstation2

|

|-Servers

IT Sverices示例

举个例子,API的SLA,各个子Service都有他的可用率,然后XXX网站API可以统计到整个API的可用率,当领导过问起来,给他看这个就行了。


IT Service

|

|-XXX网站API

| |

| |-天气API

| |

| |-新闻API

| |

| |-用户API

|

| |-....xxxAPI(省略各种api

|

|-Servers(其他services


那这些可用率是怎么计算出来的呢?根据你的触发器,除了未分类和信息这两类,其他严重性级别,例如警告(warnning)等等都会记入故障率

 

配置IT Services

configuration->IT Services->单击root->Add services

wKioL1eayy3DhToyAARHolrtkx0934.png-wh_50


创建服务器在线率

wKioL1eay3yxVSsLAARNicpGJKk779.png-wh_50


service说明

name:名称

Parent service:上级节点,这边是root

Status calculation algorithm:计算付费,共有三个选项

  • Do not calculate - 不加入计算

  • Problem, if at least one child has a problem - 子项至少一个发生故障(一般用这个)

  • Problem, if all children have problems - 所有子项都发生故障,才加入计算

Acceptable SLA (in %):可接受的可用率百分比,如果在大于这个百分比那么现实绿色,如果小于那么就是红色显示

Trigger:触发器,可以选触发器也可以不选,不过大家要记住,可用率计算的就是这些触发器的可用率,如果没有触发器根本无法计算。最上级的可以不选触发器,子项一定记得选择触发器,否则就失去意义了。

添加子service

wKioL1eazBmxsXDoAARXGtn1e6E418.png-wh_50


依赖标签

这边我们不增加依赖,在后面我们专门来谈谈这个依赖

wKioL1eazKnhUxEVAASIoYNsNkQ590.png-wh_50


wKioL1eazLuiXEZIAAPjl1L4Cls041.png-wh_50


Time这边如果默认,那么就是24x7

wKiom1eazSzQkszZAAQ7RQohWlY939.png-wh_50

Time说明

Service times:定义好的工作时间

New service time:一共有三个选项

  • Downtime - 在这个时间段,不计入SLA

  • One-time downtime - 在这个时间段,不计入SLA,指定一个时间(只有一次)

  • Uptime :工作时间,在这个时间内出现故障都计入SLA

看看效果,monitoring-->IT services

wKiom1eazZ2iuUf8AARftjXquRQ020.png-wh_50

IT Services依赖

分为hard和soft依赖,例如我们增加一个C服务器,他需要依赖其他IT树下的services,首先它不能链接触发器,在依赖那边选择其他树下依赖即可,可以添加多个,软依赖是灰色的标识,硬件依赖则是直接把整个service挪过来。如果C服务器使用软依赖,那么可以直接删除C服务器Service,如果是硬依赖,需要先移除依赖,才能删除。

wKiom1eaznuzEm7OAAPkJy0Ty-w525.png-wh_50

如下,原本“测试”和“服务器在线率”在同一个层级,都归属于root,但是加了硬依赖之后,直接到了C服务器只下了

wKiom1eazvzzJU9zAAICv03WG8E373.png-wh_50

接着来看看软依赖,勾选soft,就是软依赖了

wKiom1eazzmidXyrAAE8UczvJQk298.png-wh_50

看下图,和硬依赖很不相同,C服务器下的测试是灰色的,并且“测试”依旧和“服务器在线率”在同一个层次。

wKioL1eaz2qiz3AUAAI5KXBGt8Y118.png-wh_50

此时你可以直接删除C服务器,但是硬依赖的情况下不行哦。

好了,zabbix IT SERVICES就到这里了,可以给领导开个权限,这样他也可以了解到服务器整体状况了。运维们也需要经常看,毕竟这是调整的一个一句。





本文转自青衫解衣 51CTO博客,原文链接:http://blog.51cto.com/215687833/1831640


相关文章
|
2月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
99 2
|
1月前
|
监控 数据可视化 BI
服务器监控软件Zabbix
【10月更文挑战第19天】
57 6
|
4月前
|
微服务
【Azure Cloud Services】云服务频繁发生服务器崩溃的排查方案
【Azure Cloud Services】云服务频繁发生服务器崩溃的排查方案
|
4月前
|
监控 关系型数据库 MySQL
如何在 Ubuntu 16.04 上安装和配置 Zabbix 以安全监控远程服务器
如何在 Ubuntu 16.04 上安装和配置 Zabbix 以安全监控远程服务器
48 0
|
5月前
|
弹性计算 运维 Kubernetes
阿里云ECS与混合云策略的结合,不仅为企业搭建了一个既灵活又稳定的IT基础架构,还为业务的快速发展与创新提供了坚实的技术支撑。
【7月更文挑战第3天】阿里云ECS在混合云中扮演关键角色,提供弹性计算资源和多样计费模式,确保业务连续性与灵活性。通过VPC互通、应用迁移、数据同步服务,如VPC对等连接、DTS,实现云上云下资源的高效整合。结合安全解决方案,保证在混合环境下的合规与安全。阿里云ECS助力企业数字化转型,应对市场变化。
134 1
|
7月前
|
弹性计算 运维 监控
【阿里云弹性计算】从物理机到阿里云ECS:企业IT架构转型升级之路
【5月更文挑战第29天】随着云计算兴起,企业正转向阿里云ECS以应对传统物理机的挑战。本文详述了这一转型过程,包括现状评估、迁移计划制定、测试环境搭建、应用数据迁移及后期监控优化。转型升级可提升资源利用率,降低运维成本,加快业务响应,并增强数据安全。示例代码展示了使用阿里云Python SDK创建ECS实例的过程。
211 1
|
7月前
|
缓存 监控 安全
zabbix服务器监控之了解agent的启动过程
zabbix服务器监控之了解agent的启动过程
226 0
|
7月前
|
监控 前端开发
Zabbix使用外部邮箱服务器发送邮件报警
Zabbix使用外部邮箱服务器发送邮件报警
|
1月前
|
监控 Java Shell
监控堆外第三方监控工具Zabbix
监控堆外第三方监控工具Zabbix
39 5
|
27天前
|
监控 安全 前端开发
使用 Zabbix 监控堆外应用
使用 Zabbix 监控堆外应用
44 9

推荐镜像

更多