云服务器 ECS 监控:监控ECS实例

本文涉及的产品
云监控,每月短信1000条
简介:


监控ECS实例

一般来说,在本地数据中心我们会对基础设施进行监控,其中包括对主机实例的监控,以便系统地和随时地了解资源使用情况和性能变化,在出现性能瓶颈的时候合理地调配资源,或者在发生故障时追溯原因等等。

在阿里云上,ECS实例也承载着我们的业务应用,ECS实例的资源使用情况和性能负载直接影响着其上应用的运行稳定性和用户体验度。假如没有进行监控,就很有可能在业务高峰期性能不足却无人问津而导致宕机;也可能在出现异常和故障的时候,因为没有历史性能数据而无法进一步追查到原因,可见,没有监控,当问题出现的时候,都非常被动。

因此,监控是非常有必要的,是构建完整IT系统不可或缺的一个元素,下面就来介绍如何对ECS实例进行监控。

使用Dashboard

云监控的Dashboard功能提供用户自定义查看监控数据的功能。用户可以在一张监控大盘中跨产品、跨实例查看监控数据,将相同业务的不同产品实例集中展现。既能满足排查故障时查看监控细节,又能满足总览大局时查看服务概貌。

操作步骤

1、登录云监控控制台。

2、点击左侧菜单的“Dashboard”选项,进入Dashboard页面。可以看到默认展示的“ECS全局监控大盘”。

image


3、可以看到默认的“ECS全局监控大盘”已经包含了比较丰富的监控项了,包括CPU使用率、网络流入/流出带宽、系统磁盘BPS、系统盘IOPS、网络流入/流出量。基本已经可以满足日常监控需求。

4、如果业务比较复杂,需要自定义监控可视化需求时,可以创建新的监控大盘,点击页面右上角的“创建监控大盘”,输入监控大盘的名称。


image


5、然后可以在该大盘上添加云产品指标和用户的业务监控指标。

6、添加云产品指标。

a) 选择需要查看的云产品和实例所在地域;

b) 定义图标名称,图表名称默认为您生成“产品名称+区域”,选择图表展现形式;

c) 选择需要查看的监控项、选择监控数据的聚合方式,常见聚合方式为最大值、最小值、平均值、选择过滤条件、选择Group By的维度。


image


7、添加业务指标监控。

a) 定义图表名称、指标名称、图表类型;

b) 选择需要查看的监控数据并定义处理方式;

c) 点击发布。


image


主机监控

云监控主机监控服务通过在服务器上安装插件,为用户提供服务器的系统监控服务。主机监控服务采集丰富的操作系统层面监控指标,可以使用主机监控服务进行服务器资源使用情况的查询和排查故障时的监控数据查询。

操作步骤

1、登录云监控控制台。

2、通过选择左侧菜单的主机监控,进入主机监控页面。

3、点击实例列表中的“点击安装”插件,安装云监控插件。


image


4、1-3分钟后即可点击实例列表页的“监控图表”查看监控数据。


image


5、可以看到有操作系统监控、基础监控、进程监控。其中涵盖了CPU、内存、负载、磁盘、网络、进程各面的性能统计,并且可以根据时间范围来展示图标数据。

6、创建报警规则。

a) 切换到报警规则页面;


image


b) 点击“这里”创建规则;

c) 在新建报警规则页面填写设置报警的具体参数;


image
image
image


d) 保存规则设置,完成报警规则的创建。

站点监控

如果ECS实例提供的主要业务应用是网站类型,可以考虑使用站点监控模拟真实用户访问情况,探测API可用性、端口连通性、DNS解析等问题。可以探测域名、IP、端口的连通性、访问响应时间,并对监控结果报警。

操作步骤

1、登录云监控控制台。

2、点击站点管理,进入站点监控页面。

3、点击页面右上角的创建监控点,添加新的监测点。


image

4、点击左侧菜单的“站点管理”选项,进入站点监控页面。

image


5、查看站点监控详情。


image


开源监控产品介绍

目前业内有不少开源的监控软件,包括zabbix、nagios、zenoss等,每个产品都有各自的特色和优势,下面分别简单介绍一下以上几款产品。

  • zabbix

Zabbix是一个基于WEB界面的提供分布式系统监控以及网络监控功能的企业级开源运维平台,也是目前国内互联网用户中使用最广的监控软件,85%以上的泛互联网企业都在使用Zabbix做监控解决方案。

zabbix入门容易、上手简单、功能强大并且开源免费,它易于管理和配置,能生成比较漂亮的数据图,其自动发现功能大大减轻日常管理的工作量,丰富的数据采集方式和API接口可以让用户灵活进行数据采集,而分布式系统架构可以支持监控更多的设备。理论上,通过Zabbix提供的插件式架构,可以满足企业的任何需求。

  • nagios

Nagios是一款开源的企业级监控系统,能够实现对系统CPU、磁盘、网络等方面参数的基本系统监控,以及SMTP,POP3,HTTP,NNTP等各种基本的服务类型。另外通过安装插件和编写监控脚本,用户可以实现应用监控,并针对大量的监控主机和多个对象部署层次化监控架构。

Nagios最大的特点是其强大的管理中心,尽管其功能是监控服务和主机的,但Nagios自身并不包括这部分功能代码,所有的监控、告警功能都是由相关插件完成的。

  • zenoss

Zenoss Core是Zenoss的开源版本,其商用版本为ZenossEnterprise。作为企业级智能监控软件,Zenoss Core允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss同时提供与CMDB关联的事件和错误管理系统,以协助提高各类事件和提醒的管理效率。

Zabbix vs 云监控

Zabbix是第三方开源监控软件,是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。

云监控既指在云端运行的监控工具,也指监控在云端运行的应用程序的工具。通过和云计算平台的整合,针对网络、系统、应用等内容提供可用性、用户体验和安全性方面的监控服务。

云监控的到来,无疑给那些对技术不太熟悉的人员带来了福音,可以通过页面点击就可以创建自己的监控项。

产品 优点 缺点
Zabbix 支持多平台、分布式;

安装部署简单,多种数据采集插件灵活集成;

可实现复杂多条件告警;

自带画图功能,得到的数据可以绘成图形;

提供多种API接口,支持调用脚本;

出现问题时可自动远程执行命令;
项目批量修改不方便;

中文资料较少,服务支持有限;

入门容易,但是深层次需要非常熟悉zabbix并进行大量的二次定制开发,难度较大;

系统级别报警、报警邮件、自定义项目报警需要自己设置,过程繁琐;

缺少数据汇总功能,数据报表也需要进行二次开发;
云监控 无前期成本投入;

无需独立服务器;

配置及添加监控项简单;

页面风格比较适合国人操作;
部分平台免费版功能较少,企业级应用费用较高;

账户管理功能较弱;

修改监控点配置不方便;

自定义监控配置麻烦,部分需写脚本;

监控项目单一;

部分监控项无法实现图形化显示;

可以看出,各有各的优劣势。云监控降低我们监控的门槛,给我们提供了便利,但是在一定程度上限制了自定义和扩展。而zabbix可以灵活集成并可通过二次开发实现复杂功能,但是对人员和技能的要求也比较高。

对于上监控以更好地保障系统上线后稳定运行,我们还需要关注监控的一些方法。

除了需要了解我们的常规的监控项如硬件资源、性能、带宽、端口、进程、服务的检测机制之外,还要具备安全意识,比如需要知道哪些服务器可能出现问题,可能被入侵等。

另外,需要定义监控策略,包括告警的优先级、告警内容等;对监控的业务系统进行分级,比如一级系统724小时告警,二级系统712小时告警。

如果架构比较庞大,也可以对监控对象范围进行分类,如服务器监控、应用程序监控、数据库监控、网络监控等,根据监控对象再细分监控项。每个维护人员都可以根据企业环境总结出一套适合于自身的监控体系,并逐渐精细化和智能化。

通过使用阿里云云监控,能较好地对我们的ECS实例进行监控,使我们及时了解业务的运行状态,并及时提供告警,让我们可以快速定位故障,对我们管理和维护ECS提供了可靠的支持。当然,在此基础上我们也可以结合如zabbix之类的开源监控软件,进一步实现对ECS实例更全面和精准的监控。

原文链接

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3天前
|
存储 编解码 缓存
阿里云服务器实例规格选择参考:根据业务场景选择云服务器实例规格
在阿里云服务器的购买过程中,云服务器实例规格是很多用户最难选择的一个选项,因为阿里云有着多达几十种不同的实例规格,为此,阿里云官方在云服务器购买页面新推出了一个场景化选型推荐,用户可通过自己的上云场景结合场景化选型里面的业务场景和细分场景来选择适合自己的阿里云服务器实例规格,在很大程度上解决了新手用户在选择阿里云服务器实例规格上的困局。
阿里云服务器实例规格选择参考:根据业务场景选择云服务器实例规格
|
2天前
|
Cloud Native Java 编译器
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
随着云计算技术的不断发展,云服务商们不断推出高性能、高可用的云服务器实例,以满足企业日益增长的计算需求。阿里云推出的倚天实例,凭借其基于ARM架构的倚天710处理器,提供了卓越的计算能力和能效比,特别适用于云原生、高性能计算等场景。然而,有的用户需要将传统基于x86平台的应用迁移到倚天实例上,本文将介绍如何将基于x86架构平台的应用迁移到阿里云倚天实例的服务器上,帮助开发者和企业用户顺利完成迁移工作,享受更高效、更经济的云服务。
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
|
6天前
|
存储 编解码 网络协议
阿里云服务器通用型g8y实例与通用型g7收费标准与性能区别参考
阿里云服务器通用型g7、通用型g8y实例都是阿里云目前活动中可选的通用型实例规格,它们同属于通用型实例,但是他们之间是有一些区别的。通用型g7属于第七代云服务器,而通用型g8y属于倚天云服务器,是最新一代的云服务器实例。本文为大家介绍一下它们在收费标准及性能方面的一些区别,以供参考。
阿里云服务器通用型g8y实例与通用型g7收费标准与性能区别参考
|
7天前
|
存储 机器学习/深度学习 安全
阿里云服务器计算型c8i和通用型g8i实例性能、收费标准和适用场景参考
阿里云不断推出高性能云服务器实例以满足不同用户的需求。其中,计算型c8i与通用型g8i实例凭借卓越的性能和灵活的配置,成为企业级用户的热门选择。计算型c8i和通用型g8i实例采用阿里云全新CIPU架构,可提供稳定的算力输出、更强劲的I/O引擎以及芯片级的安全加固,单台实例最高支持100万IOPS,CPU采用Intel®Xeon®Emerald Rapids或者Intel®Xeon®Sapphire Rapids,主频不低于2.7 GHz,全核睿频3.2GHz。本文将深入探讨这两款实例的性能特点、最新收费标准以及适用场景和活动价格情况,以供大家了解和选择。
阿里云服务器计算型c8i和通用型g8i实例性能、收费标准和适用场景参考
|
8天前
|
存储 缓存 安全
阿里云服务器经济型、通用算力型、计算型、通用型、内存型实例区别及选择参考
阿里云服务器的实例规格有经济型、通用型、计算型、内存型、通用算力型、大数据型、本地SSD型、高主频型、突发型、共享型等不同种类的实例规格,在阿里云的活动中,主要以经济型、通用算力型、计算型、通用型、内存型实例为主,相同配置的云服务器往往有多个不同的实例可选,而且价格差别也比较大,这会是因为不同实例规格的由于采用的处理器不同,底层架构也有所不同(例如X86 计算架构与Arm 计算架构),因此不同实例的云服务器其性能与适用场景是有所不同。本文为大家详细介绍阿里云的经济型、通用算力型、计算型、通用型和内存型实例的性能特点及适用场景,以供大家选择参考。
阿里云服务器经济型、通用算力型、计算型、通用型、内存型实例区别及选择参考
|
3天前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
14天前
|
存储 弹性计算 负载均衡
阿里云服务器地域、实例、带宽与操作系统等配置选择指南参考
在数字化时代,无论是个人博客、企业官网、APP后端支持,还是小程序运行或者其他项目,云服务器都扮演着至关重要的角色,考虑产品质量、服务和价格等因素,大家现在都喜欢选择阿里云服务器。然而,对于初次接触云服务的新手来说,可能并不是很清楚应该如何选阿里云服务器的地域、实例、带宽与操作系统等配置。本文将从地域选择、实例规格、操作系统、云盘配置、购买时长以及带宽选择等六个方面,为新手用户提供详细的选购指南,以供参考。
阿里云服务器地域、实例、带宽与操作系统等配置选择指南参考
|
6天前
|
弹性计算 JSON 运维
阿里云ECS实例运维属性-如何控制实例的宕机表现
介绍如何通过运维属性指定阿里云ECS的宕机运维表现等
|
11天前
|
弹性计算 运维 监控
阿里云ECS实例使用示例
使用阿里云ECS实例的流程简便快捷:登录阿里云控制台,在ECS实例列表中选择目标实例并进入详情页,点击“启动”按钮激活实例,确保预装系统和应用完成。运行后,通过控制台监控CPU、内存及磁盘使用情况,如需调整配置,可选择实例后点击“重启”应用新设置。阿里云ECS助力企业轻松上云、高效运维。[1][3] 相关链接:阿里云ECS使用流程 https://startup.aliyun.com/info/1078898.html
|
9天前
|
存储 监控 Linux
监控Linux服务器
详细介绍了如何监控Linux服务器,包括监控CPU、内存、磁盘存储和带宽的使用情况,以及使用各种系统监控工具如vmstat、iostat、sar、top和dstat来分析系统性能,并推荐了一些开源监控系统。
20 0
监控Linux服务器

热门文章

最新文章