浅述各种监控方案使用场景

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
日志服务 SLS,月写入数据量 50GB 1个月
可观测监控 Prometheus 版,每月50GB免费额度
简介: 监控是运维的第一道防线,业务系统可以不做运维自动化,甚至可以不做DevOps,但一定不能不做监控。监控是业务的“眼睛”,能让对应的异常问题在第一时间被发现,只有这样我们才能第一时间去解决问题。

监控是运维的第一道防线,业务系统可以不做运维自动化,甚至可以不做DevOps,但一定不能不做监控。监控是业务的“眼睛”,能让对应的异常问题在第一时间被发现,只有这样我们才能第一时间去解决问题。运维工作做的好不好,更多的是看监控有没有加好。下面是从传统环境到云环境各种监控方案使用的场景及特点介绍。


1、脚本监控

应用场景

通过Shell或者Python脚本,甚至Java、PHP来完成监控需求。这个监控解决方案一般用于不懂运维的研发人员,他们一般没听说过监控系统,也不知道用什么监控系统,所以就用自己擅长的开发语言,来完成日常的监控需求。

特点介绍

主要做些系统基础监控指标(CPU/内存/网卡/磁盘)报警。缺乏中间件、应用层监控。缺乏监控数据存储、数据查看等监控集中化管理平台。


2、Nagios监控

应用场景

IT基础架构监控的行业标准,主要应用在主机系统、交换机路由器等网络设备的监控上。

特点介绍

主要偏向做主机系统、交换机路由器等网络设备的监控。偏向主机层面监控,比如在Nginx、Tomcat等应用中间件性能方面监控偏弱。监控数据的图形展示效果很差。很多功能通过插件化来实现,对技术能力要求很高。


3、Nagios+Cacti监控

应用场景

Cacti是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具。Cacti可以单独部署使用用以监控网络流量,监控数据图形界面展示效果比较好。整合Cacti和Nagios是利用了Cacti的一个插件Nagios for Cacti(NPC),它的原理是将Nagios的数据通过ndo2db导入到MySQL数据库(Cacti的库)中,然后Cacti读取数据库信息将Nagios的结果展示出来。

特点介绍

Cacti的良好数据展示,弥补了Nagios监控软件的不足,但监控的内容和Nagios是一样的。


4、Zabbix监控

应用场景

Zabbix不仅仅能做Nagios主机、网络设备层面的监控,还能满足企业级其他方面的监控需求,用于监控中间件、日志。有完善详细的API,支持企业级定制化开发。可以通过API把Zabbix集成在其他运维自动化平台中。

特点介绍

资料丰富,入门简单,有完善的社区支持,有详细的报表图标绘制,支持自动发现网络设备和服务器,支持分布式集中管理、管理监控点。但是Server端的数据存储用的是以MySQL为主的关系型数据库,Server端存在很严重的性能问题。需要在监控的目标主机中安装Agent,这样将会存在安全隐患。同时对容器监控支持还在持续完善。


5、云监控

应用场景

云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。云监控是一项针对阿里云资源和互联网应用进行监控的服务。

特点介绍

提供自定义查看监控数据的功能,可以在一张监控大盘中跨产品、跨实例查看监控数据,将相同业务的不同产品实例进行集中展现。

提供跨云产品、跨地域的云产品资源分组管理功能,支持从业务角度集中管理业务线涉及的服务器、数据库、负载均衡、存储等资源。

提供云产品服务各类异常事件的报警功能,也支持自定义事件类型数据的上报、查询、报警功能。

开源中间件之类的监控,需要通过自定义监控调用云API来完成,有一定的研发要求,监控门槛较高。


6、Prometheus+Grafana监控

应用场景

监控系统&时序数据库,Prometheus是一个监控系统,并没有和关键字IT有所关联,这是因为任何监控目标,只要暴露出标准的HTTP协议的Metric数据,Prometheus就都能监控到。类似于容器监控需求,通过Prometheus很方便地就能实现,因此Prometheus被誉为容器开源解决方案的最佳实践。

特点介绍

时序数据库是典型NoSQL分布式数据库,使用它不用担心数据库的性能问题。

灵活的数据模型,特别适用于对动态灵活性高的容器的监控。

采用HTTP协议,使用pull模式拉取数据,简单易懂。

要每个中间件或者监控目标都要单独安装Export,如果有多个监控目标的话,多个监控目标对应暴露HTTP服务端口,在维护管理等方面非常不便。

Prometheus的监控项值只能为浮点数据类型,不能为字符串数据类型,这个就具有局限性了。


7、Telegraf+InfluxDB+Prometheus监控

应用场景

解决了原生态Prometheus需要安装多个Export且只能存储浮点数据类型的问题,同时也解决了TICK技术栈中在监控数据图形展示、报警通知等方面的缺陷。

特点介绍

但是该架构仅解决了主机+中间件的监控问题,无法解决以下监控问题:

云产品监控:对RDS、SLB、OSS、VPC、CDN等云产品的监控。

站点监控:站点的可用性、响应时间、延时监控。

日志监控:日志的存储、日志查询、日志监控报警。

代码监控:业务代码层次,比如Java、PHP代码层面的性能监控。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
监控 网络协议 Shell
【Shell 命令集合 网络通讯 】Linux 监控和记录网络中ARP(Address Resolution Protocol)活动 arpwatch命令 使用指南
【Shell 命令集合 网络通讯 】Linux 监控和记录网络中ARP(Address Resolution Protocol)活动 arpwatch命令 使用指南
407 0
|
测试技术 API 开发工具
在Python中实现安卓手机自动化
在Python中实现安卓手机自动化
1629 0
|
Java Apache 数据格式
httpclient 解决 connection reset 问题
  httpclient 解决 connection reset 问题   错误如下:   java.net.SocketException: Connection reset at java.
9055 0
|
负载均衡 容灾 应用服务中间件
使用Docker-compose搭建nginx-keepalived双机热备来实现高可用nginx集群
最近同学出去面试经常会被问到一个问题。 面试官:你说你们公司使用nginx反向代理tornado,部署了多少多少台机器,好像很牛逼的样子,但是我问你,如果主机也就是部署了nginx那台机器并发过大导致宕机了怎么办? 答曰:不考虑带宽峰值的话,比较新的 CPU 跑 nginx 单核每秒能接近 2 万请求,而且nginx如果纯做 HTTP 转发的话,Nginx 的性能高到恐怖,会挂掉很不科学。。。。 面试官:好吧,算你会忽悠,那如果插头被扫地大妈踢掉了怎么办,因为没电导致服务器宕机 答曰:阿里云机房会断电。。。你特么在逗我吧。。
使用Docker-compose搭建nginx-keepalived双机热备来实现高可用nginx集群
|
11月前
|
安全 开发者
内存池的优缺点分别是什么
内存池的优缺点分别是什么
318 1
|
存储 JavaScript 前端开发
无需构建工具,快速上手Vue2 + ElementUI
在不使用构建工具的情况下,快速搭建Vue2+ElementUI应用:直接在HTML中引入Vue和Element UI的CDN,创建Vue实例,绑定数据和组件。示例展示了如何使用Element UI的按钮和复选框组创建权限设置界面。通过Vue的响应式系统和组件化实现数据绑定和界面更新。完整代码包括设置权限按钮和三个复选框组,预设了城市权限选项。
508 0
无需构建工具,快速上手Vue2 + ElementUI
|
存储 设计模式 ARouter
组件化框架 ARouter 完全解析(一)
组件化框架 ARouter 完全解析(一)
587 2
|
Web App开发 人工智能 自然语言处理
2023 年最好的36款 AI 生产力工具(七)
本文主要展示了36 款 AI 应用,可以帮助读者更快、更好地工作。每个人都在与ChatGPT交流,从完整的博客文章到特定代码行的功能都在询问。其结果令人惊叹。虽然我们仍在探索如何将这项技术纳入我们的工作流程中,但明显的是,人工智能工具正在改变游戏规则。尽管ChatGPT是目前最受欢迎的,但它远不是首款进入市场的人工智能应用程序。经过Zapier团队的大量研究和测试,总结出了以下36款能够改变工作方式的人工智能生产力工具。
282 1
|
存储 监控 NoSQL
Redis内存碎片:深度解析与优化策略
Redis内存碎片主要是因为Redis数据存储和回收过程中的内存管理问题导致的
882 0
Redis内存碎片:深度解析与优化策略
|
机器学习/深度学习 编解码 人工智能
高效轻量级语义分割综述
语义分割是自动驾驶中视觉理解的重要组成部分。然而当前SOTA的模型都非常复杂和繁琐,因此不适合部署在计算资源受限且耗时要求较低的车载芯片平台上。本文深入研究了更紧凑、更高效的模型以解决上述问题,这些模型能够部署在低内存嵌入式系统上,同时满足实时推理的需求。本文讨论了该领域一些优秀的工作,根据它们的主要贡献进行归类,最后本文评估了在相同软硬件条件下模型的推理速度,这些条件代表了一个典型的高性能GPU和低内存嵌入式GPU的实际部署场景。本文的实验结果表明,许多工作能够在资源受限的硬件上实现性能和耗时的平衡。
高效轻量级语义分割综述