阿里云上监控知多少(上)

简介: 这次我们聊了一下云监控,下次我们再来了解一下应用实时监控。

“可监控、可灰度、可回滚” 据说是阿里集团内部有关系统稳定性的“三板斧”,作为第一步的“可监控”自然是所有业务条线的一项“刚需”,那么到底如何实现“可监控”就让我们从阿里云的现有监控服务产品中来一窥究竟吧。

阿里云目前有两大监控服务体系,一个是偏向于云基础架构侧的“云监控”、一个是偏向于应用侧的“应用实时监控”,这次就让我们先来了解一下云监控。

云监控的监控能力主要覆盖如下方面:

  • 主机监控、用于最普遍的阿里云服务ECS的监控,主要监控CPU、内存、网络和存储IO的各项指标,也能够对系统内的关键进程进行监控,例如对ECS上运行的MySQL进程进行监控。
  • 云产品监控、就像云主机一样,绝大部分的阿里云产品都接入了云监控的体系中,例如SLB监控,能够对负载均衡的并发连接数、后端ECS的异常和健康数量、七层负载均衡的QPS数、各种HTTP状态码的统计等进行监控、再例如RDS的监控能够对RDS服务的各项子服务、网络使用情况、实例的性能和SQL执行信息等进行监控。
  • 站点监控、通过分布在全球各地的阿里云数据中心对目标站点发起模拟的探测访问,探测的对象可以是任意域名和IP地址、探测的内容包括端口的联通性、访问的响应时间等,支持的协议包括HTTP/HTTPS、PING、TCP、UDP、DNS、SMTP、POP3、FTP。
  • 自定义监控、可以通过云监控的上报数据接口将任意业务指标上报至云监控,云监控的上报数据方式包括:通过发送HTTP请求上报、通过Java SDK上报、通过命令行上报。
  • 容器监控、Kubernetes已经成为了云原生的事实标准,因此和ECS一样云监控也将面向Kubernetes的容器监控从其他云服务监控中单列了出来。假如您使用了阿里云的ACK服务则可以使用容器监控对k8s集群、节点、命名空间、应用和容器组的各项指标进行监控。

除了被动对云服务的监控外,云监控还能将监控信息和云服务对接并主动干预云服务的行为,例如对于阿里云的ESS弹性伸缩服务来说,可以通过对接云监控实现对当下负载的感知并自动触发伸缩任务。

当指标异常时,云监控支持通过电话、短信、旺旺、邮件、钉钉机器人、阿里云App等多种方式进行报警信息的推送,例如可以通过设置钉钉机器人来将报警信息发送到群聊,一次性通知多人进行处理。

这次我们聊了一下云监控,下次我们再来了解一下应用实时监控。

目录
相关文章
|
弹性计算 监控 网络协议
ecs资源监控操作
监控阿里云ECS服务器资源分为7步:登录阿里云控制台,进入ECS管理界面,选择要监控的实例,查看基础监控数据,通过云监控服务获取详细图表、配置报警规则,可选安装云监控插件获取OS级数据,最后定期审查优化资源配置。通过这些步骤,确保系统稳定运行并及时处理问题。如需帮助,参考官方文档或联系阿里云支持。
702 3
|
SQL 分布式计算 大数据
【大数据技术Hadoop+Spark】Spark SQL、DataFrame、Dataset的讲解及操作演示(图文解释)
【大数据技术Hadoop+Spark】Spark SQL、DataFrame、Dataset的讲解及操作演示(图文解释)
709 0
|
8月前
|
域名解析 运维 监控
如何检测服务器是否被入侵?解析5大异常指标
本文系统介绍了服务器入侵的五大检测维度:硬件资源、网络流量、系统日志、文件完整性及综合防护。涵盖CPU、内存异常,可疑外联与隐蔽通信,登录行为审计,关键文件篡改识别等内容,并提供实用工具与防护建议,助力运维人员快速发现潜在威胁,提升系统安全防御能力。转载链接:https://www.ffy.com/latest-news/1916688607247077376
568 0
如何检测服务器是否被入侵?解析5大异常指标
|
人工智能 JSON 小程序
【一步步开发AI运动APP】七、自定义姿态动作识别检测——之规则配置检测
本文介绍了如何通过【一步步开发AI运动APP】系列博文,利用自定义姿态识别检测技术开发高性能的AI运动应用。核心内容包括:1) 自定义姿态识别检测,满足人像入镜、动作开始/停止等需求;2) Pose-Calc引擎详解,支持角度匹配、逻辑运算等多种人体分析规则;3) 姿态检测规则编写与执行方法;4) 完整示例展示左右手平举姿态检测。通过这些技术,开发者可轻松实现定制化运动分析功能。
|
测试技术 API 项目管理
API测试方法
【10月更文挑战第18天】API测试方法
552 1
|
消息中间件 数据采集 运维
一份运维监控的终极秘籍!监控不到位,宕机两行泪
【10月更文挑战第25天】监控指标的采集分为基础监控和业务监控。基础监控涉及CPU、内存、磁盘等硬件和网络信息,而业务监控则关注服务运行状态。常见的监控数据采集方法包括日志、JMX、REST、OpenMetrics等。Google SRE提出的四个黄金指标——错误、延迟、流量和饱和度,为监控提供了重要指导。错误监控关注系统和业务错误;延迟监控关注服务响应时间;流量监控关注系统和服务的访问量;饱和度监控关注服务利用率。这些指标有助于及时发现和定位故障。
1195 2
|
传感器 人工智能 机器人
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
1007 1
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
|
Prometheus 监控 Kubernetes
监控对象都有哪些分类
【10月更文挑战第9天】本文介绍了多种监控类型及其特点,包括业务监控、应用监控、组件监控、资源监控、设备监控及网络监控。
|
C语言
C语言中的复合语句
C语言中的复合语句
1599 1
|
存储 数据安全/隐私保护 计算机视觉
Python教程:一文了解从Bytes到Bits的数据转换
在Python编程中,处理数据时经常需要在字节(bytes)和位(bits)之间进行转换。这种转换在网络通信、数据加密、图像处理等领域尤为常见。本文将详细介绍如何在Python中进行字节与位之间的转换,并提供一个实用的功能:如何在指定的位位置替换位数据。
3520 4