阿里云上监控知多少(上)

简介: 这次我们聊了一下云监控,下次我们再来了解一下应用实时监控。

“可监控、可灰度、可回滚” 据说是阿里集团内部有关系统稳定性的“三板斧”,作为第一步的“可监控”自然是所有业务条线的一项“刚需”,那么到底如何实现“可监控”就让我们从阿里云的现有监控服务产品中来一窥究竟吧。

阿里云目前有两大监控服务体系,一个是偏向于云基础架构侧的“云监控”、一个是偏向于应用侧的“应用实时监控”,这次就让我们先来了解一下云监控。

云监控的监控能力主要覆盖如下方面:

  • 主机监控、用于最普遍的阿里云服务ECS的监控,主要监控CPU、内存、网络和存储IO的各项指标,也能够对系统内的关键进程进行监控,例如对ECS上运行的MySQL进程进行监控。
  • 云产品监控、就像云主机一样,绝大部分的阿里云产品都接入了云监控的体系中,例如SLB监控,能够对负载均衡的并发连接数、后端ECS的异常和健康数量、七层负载均衡的QPS数、各种HTTP状态码的统计等进行监控、再例如RDS的监控能够对RDS服务的各项子服务、网络使用情况、实例的性能和SQL执行信息等进行监控。
  • 站点监控、通过分布在全球各地的阿里云数据中心对目标站点发起模拟的探测访问,探测的对象可以是任意域名和IP地址、探测的内容包括端口的联通性、访问的响应时间等,支持的协议包括HTTP/HTTPS、PING、TCP、UDP、DNS、SMTP、POP3、FTP。
  • 自定义监控、可以通过云监控的上报数据接口将任意业务指标上报至云监控,云监控的上报数据方式包括:通过发送HTTP请求上报、通过Java SDK上报、通过命令行上报。
  • 容器监控、Kubernetes已经成为了云原生的事实标准,因此和ECS一样云监控也将面向Kubernetes的容器监控从其他云服务监控中单列了出来。假如您使用了阿里云的ACK服务则可以使用容器监控对k8s集群、节点、命名空间、应用和容器组的各项指标进行监控。

除了被动对云服务的监控外,云监控还能将监控信息和云服务对接并主动干预云服务的行为,例如对于阿里云的ESS弹性伸缩服务来说,可以通过对接云监控实现对当下负载的感知并自动触发伸缩任务。

当指标异常时,云监控支持通过电话、短信、旺旺、邮件、钉钉机器人、阿里云App等多种方式进行报警信息的推送,例如可以通过设置钉钉机器人来将报警信息发送到群聊,一次性通知多人进行处理。

这次我们聊了一下云监控,下次我们再来了解一下应用实时监控。

目录
相关文章
|
弹性计算 监控 网络协议
ecs资源监控操作
监控阿里云ECS服务器资源分为7步:登录阿里云控制台,进入ECS管理界面,选择要监控的实例,查看基础监控数据,通过云监控服务获取详细图表、配置报警规则,可选安装云监控插件获取OS级数据,最后定期审查优化资源配置。通过这些步骤,确保系统稳定运行并及时处理问题。如需帮助,参考官方文档或联系阿里云支持。
505 3
|
2月前
|
域名解析 运维 监控
如何检测服务器是否被入侵?解析5大异常指标
本文系统介绍了服务器入侵的五大检测维度:硬件资源、网络流量、系统日志、文件完整性及综合防护。涵盖CPU、内存异常,可疑外联与隐蔽通信,登录行为审计,关键文件篡改识别等内容,并提供实用工具与防护建议,助力运维人员快速发现潜在威胁,提升系统安全防御能力。转载链接:https://www.ffy.com/latest-news/1916688607247077376
219 0
如何检测服务器是否被入侵?解析5大异常指标
|
监控 Linux
jmeter-性能监控CPU、内存、IO等-监控插件详解(1)
jmeter-性能监控CPU、内存、IO等-监控插件详解(1)
jmeter-性能监控CPU、内存、IO等-监控插件详解(1)
|
运维 监控 数据可视化
大数据-171 Elasticsearch ES-Head 与 Kibana 配置 使用 测试
大数据-171 Elasticsearch ES-Head 与 Kibana 配置 使用 测试
431 1
|
Prometheus 监控 Kubernetes
监控对象都有哪些分类
【10月更文挑战第9天】本文介绍了多种监控类型及其特点,包括业务监控、应用监控、组件监控、资源监控、设备监控及网络监控。
|
消息中间件 数据采集 运维
一份运维监控的终极秘籍!监控不到位,宕机两行泪
【10月更文挑战第25天】监控指标的采集分为基础监控和业务监控。基础监控涉及CPU、内存、磁盘等硬件和网络信息,而业务监控则关注服务运行状态。常见的监控数据采集方法包括日志、JMX、REST、OpenMetrics等。Google SRE提出的四个黄金指标——错误、延迟、流量和饱和度,为监控提供了重要指导。错误监控关注系统和业务错误;延迟监控关注服务响应时间;流量监控关注系统和服务的访问量;饱和度监控关注服务利用率。这些指标有助于及时发现和定位故障。
878 1
|
存储 安全 数据安全/隐私保护
Maccy: 轻量级剪贴板管理器
【10月更文挑战第10天】
1135 4
|
Web App开发 网络安全 Windows
Chrome版本太旧,无法访问此网站www.google.com 的响应时间过长
Chrome版本太旧,无法访问此网站www.google.com 的响应时间过长
885 1
|
关系型数据库 分布式数据库 数据库
PolarDB 数据库迁移工具与策略
【8月更文第27天】随着业务的增长和技术的发展,企业常常需要对现有的数据库进行升级或迁移以适应新的需求。阿里云提供的 PolarDB 是一款高性能的关系型数据库服务,支持 MySQL、PostgreSQL 和 Oracle 三种存储引擎。本文将介绍如何利用 PolarDB 提供的迁移工具来高效地完成数据迁移工作,并探讨在迁移过程中需要注意的关键点。
918 0
|
Kubernetes 网络协议 网络安全
在K8S中,k8s中service访问有问题,该如何排查?
在K8S中,k8s中service访问有问题,该如何排查?