Nagios②:工作原理

简介:

监控的本质

服务器有很多种:web网页服务器、游戏服务器、数据库服务器、应用服务器、中央日志服务器等等等等。这些服务器就是公司在互联网上的命根子,要保证这些命根子的安全存活就是每一位运维工程师的基本职责。而Nagios就是一款监控软件,主要任务就是监控各个服务器的实时或者历史的情况。


服务器说白了就是一个高级的电脑,它的硬件设备不外乎就是CPU、内存、磁盘容量、网卡、鼠标键盘显示器等部分。而我们需要监控硬件也无非就是监控以上几项。

CPU:了解其使用百分比,通过百分比能了解CPU对所有任务的处理情况

内存:了解已用和可用内存数,进而了解系统内存开销

磁盘容量:对磁盘空间余量的掌握能了解磁盘内存是否还够用

网卡:网卡的吞吐率了解网络上行下行的情况,避免网络堵塞


上面说的是硬件部分,下面说说软件部分。


以网页服务器为例,一般来说一个网页服务器内部所安装的重要软件无外乎就是以下几种:Apache、Tomcat、Nginx。而这三位主要监控的对象就是“端口存活和可达状态“,进而推断HTTP服务是否正常。其实无论是硬件数据还是软件数据在linux上都有对应的命令可以显示,但是由于运维人员所要负责的服务器可能较多,一台一台的输命令比较无聊,而且linux反馈的是数字而不是图像那种更加直观的形式,况且当数值到达阈值的时候,监控软件可以采取应急措施并且通过邮件或者短信形式通知负责人,所以引入监控软件是很有必要的。


Nagios的工作原理

一般来说,企业内部的网络拓扑图应该是这个样子的。

wKiom1cMun_CZAqmAAGG_tpnOs0506.png

而nagios可能就安装在上面“应用服务器”中的某一台,由于这几个服务器在同一个网段,他们之间是可以互相通信的,所以nagios就可以采集到其他服务器的硬件软件数据,然后我们可以登陆nagios服务器,以网页的形式输出这些数据。


wKiom1cM4ZORzrnWAAEdWr-uC1Y855.png

nagios的工作基本原理就是上面的图,监控主机上安装了nagios软件,而nagios就通过check_nrpe模块以SSL协议与目标服务器的NRPE模块进行通信,目标服务器的NRPE模块收到监控指令后,启动check_disk等外部插件对目标机器进行数据采集,然后将采集结果返回到NRPE模块,再有NRPE模块呈递给监控主机的nagios core,而nagios将这些信息通过cgi解析,以web网页的形式呈现在屏幕上供工作人员观看。


 本文转自 苏幕遮618 51CTO博客,原文链接:http://blog.51cto.com/chenx1242/1763067


相关文章
|
JSON 缓存 应用服务中间件
开源API网关APISIX源码分析(一)
开源API网关APISIX源码分析
488 0
|
存储 NoSQL 数据库
时序数据库连载系列: 时序数据库一哥InfluxDB之存储机制解析
InfluxDB 的存储机制解析 本文介绍了InfluxDB对于时序数据的存储/索引的设计。由于InfluxDB的集群版已在0.12版就不再开源,因此如无特殊说明,本文的介绍对象都是指 InfluxDB 单机版 1. InfluxDB 的存储引擎演进 尽管InfluxDB自发布以来历时三年多,其存储引擎的技术架构已经做过几次重大的改动, 以下将简要介绍一下InfluxDB的存储引擎演进的过程。
7046 0
|
7月前
|
SQL 数据采集 监控
VeryReport:高效智能的报表软件,助力企业数据可视化决策
VeryReport:高效智能的报表软件,助力企业数据可视化决策
|
监控 前端开发 关系型数据库
|
Docker 容器
解决failed to solve with frontend dockerfile.v0: failed to create LLB definition: unexpected status co
解决failed to solve with frontend dockerfile.v0: failed to create LLB definition: unexpected status co
3215 0
解决failed to solve with frontend dockerfile.v0: failed to create LLB definition: unexpected status co
|
11月前
|
网络协议 安全 数据挖掘
IPv6与IPv4有何不同
【10月更文挑战第26天】IPv6与IPv4相比,具有更大的地址空间、更小的路由表、增强的组播支持、自动配置支持和更高的安全性。IPv6地址长度为128位,几乎无限的地址资源解决了IPv4地址枯竭的问题;聚类原则减少了路由表大小,加快数据转发速度;自动配置简化了网络管理;加密技术提升了网络安全性。企业迁移到IPv6可以确保未来网络的可持续发展,提高效率和安全性。
590 0
|
10月前
|
人工智能 并行计算 Linux
《C++与 CUDA:开启人工智能算法加速之旅》
在AI快速发展的今天,计算效率成为关键挑战。CUDA作为英伟达推出的高性能并行计算平台,极大提升了AI算法的处理速度。本文详细介绍如何在C++环境中安装配置CUDA库,包括系统要求、安装步骤、验证方法及优化技巧,助力开发者高效利用GPU加速AI应用,开启算法加速的新篇章。
229 25
|
10月前
|
监控 Linux 网络安全
Zabbix Agent使用介绍
Zabbix Agent使用介绍
424 10
|
11月前
|
机器学习/深度学习 人工智能 算法
【AI系统】AI系统概述与设计目标
本文介绍了AI系统的全栈架构,涵盖设计目标、组成和生态。AI系统旨在连接硬件与应用,提供高效的模型服务和开发支持。文中探讨了高效编程语言、开发框架、工具链的重要性,以及AI任务系统级支持、自动编译优化和云原生自动分布式化等关键设计目标。此外,还详细讨论了AI训练与推理框架、AI编译与计算架构、AI硬件与体系结构等组成部分,以及AI算法和框架、更广泛的生态系统等。
540 1
|
12月前
|
机器学习/深度学习 人工智能 测试技术
探索 AI 驱动的软件开发:未来技术的新趋势
【10月更文挑战第19天】本文探讨了人工智能(AI)在软件开发中的应用现状和技术优势,包括代码生成、缺陷检测、自动化测试和性能优化。AI 可以提高开发效率、减少人为错误、加速创新并持续学习。文章还讨论了实施 AI 驱动开发的挑战和最佳实践,强调了数据管理和技能培训的重要性。