随着客户在云上存储资源的快速增长,与计算紧密结合的块存储产品越来越受到运维团队的关注。在业务需求快速变化的当下,想要存储资源可以满足多变的场景与突发的业务需求,需要更加精细化的监控与数据分析能力。
而传统的系统监控往往伴随两个痛点。
第一,监控系统仅针对单个实例进行采集,无法聚合分析。
第二,监控精度较低。若要提供监控数据,往往需要消耗更多的系统资源,得不偿失。
阿里云 Cloud Lens for EBS 便是为解决此类问题而生。
Alibaba Cloud Lens for EBS 通过与阿里云日志服务系统深度合作,灵活配置监控范围。不仅免于安装 agent ,无需消耗系统资源,同时也提供了秒级监控,便于客户更精确地发现系统瓶颈与分析性能问题。
同时,Cloud Lens for EBS 还可以聚合客户使用的资源情况,帮助客户快速掌握资源消耗及数据保护,提升资源使用效率的同时还可及时发现数据丢失的风险。
场景一:发现业务系统性能瓶颈
客户常常在业务突发、压力高峰时无法正常提供服务,现有监控体系无法捕捉到跨存储资源的性能数据。
Cloud Lens for EBS 提供的秒级监控使客户更容易查看系统的负载变化,从而更快地发现性能瓶颈。
场景二:快速概述系统运行状态
Cloud Lens for EBS 帮助用户采集监控数据的同时,还可基于阿里云数据分析能力与多年运营经验,为客户提前预警性能瓶颈,并提供快速升级的方案。
场景三:AutoPL云盘突发性能分析
Cloud Lens for EBS 为使用AutoPL 云盘的客户提供了性能突发数据的观测,帮助客户跟踪云盘的性能需求及使用状况。
Demo演示
首先登陆阿里云官网,点击控制台。进入控制台页面后,在浏览器栏中输入 ebs.console.aliyun.com,登陆块存储 EBS 控制台。
EBS 控制台左侧为功能菜单栏。
其中资源管理可以查看所有资源的统计信息,性能分析用于分析当前不同region、不同可用区域的云盘使用状况以及AutoPL Burst云盘的性能,配置管理用于开启或关闭 Cloud Lens for EBS 对客户数据的收集,风险管理用于分析客户不同的云盘处于什么样的风险状况。
上图为资源管理页面,展示了云盘总数量、总容量、地域、可用区等信息。通过资源概览,可以掌握整体云盘的使用情况。
性能分析包含AutoPL Burst分析和TOP性能分析。
AutoPL Burst分析主要帮助客户了解AutoPL云盘在什么情况下、什么时间点发生了性能突发状况以及突发的数量。
比如上图,某块云盘在2022 年 9 月 26 号 12 点时发生了 956,470 个 burst,即性能突发的 IO 数量。点击云盘 ID ,通过弹窗可以看到,在 12:25和12:29 两个时间段发生了业务突发情况。
TOP性能分析主要用于帮助客户了解整体的性能情况,以及针对不同的云盘性能做更详细的秒级分析。比如选择本周,点击查询,即可查看本周所有云盘的吞吐量、 iops 情况以及不同的写吞库TOP值与读吞吐 TOP值。点击云盘 ID 可查看云盘的完整趋势与云盘属性。
配置管理主要负责管理在 Cloud Lens for EBS 中为客户提供哪些云盘的数据采集。可以通过关闭或开启操作来对云盘的数据进行分析采集,也可以将采集的数据投掷到日志服务中,保存更长的时间,便于客户进行后续的数据分析。
风险管理包含性能与数据保护两个层面。
性能侧提供了不同的地域云盘类型、云盘 ID 与时间的分析,用于筛选账户中存在性能风险的云盘。
云盘到达性能上线会影响在线业务,因此,我们还提供了通过不同的功能比如在线编排或扩容来实现对云盘性能的提升,从而满足业务需求。
数据保护侧,通过地域、云盘类型、云盘ID与时间来帮助客户查找没有快照保护的数据云盘的情况。
点击资源概览-告警中心,自定义告警的功能能够帮助客户自定义告警事件来解决云盘超出性能上线的告警。
点击添加按钮来实现告警的配置,选择相关参数,比如告警周期与范围、告警的阈值与发送告警的策略等,帮助更好地管理告警事件。
同时,Alibaba Cloud Les for EBS具备投递到SLS实现更多数据分析的能力。概览页面中提供了数据接入的采集,可以在接入管理的操作界面实现对采集操作的处理。点击开启或关闭,可以选择保存的时间与地域来投递到用户的SLS目录中。