Alibaba Cloud Lens for ALB最佳实践

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
EMR Serverless StarRocks,5000CU*H 48000GB*H
网络型负载均衡 NLB,每月750个小时 15LCU
简介: 孙玉梅阿里云智能高级研发工程师

image.png

2021可观测与智能运维国标编写已启动,提出了云平台的云产品应具备完善的可观测能力。Gartner预测,到 2024 ,将有 30% 的企业使用可观测技术来优化资源,加速问题定位,提升用户体验,尤其是使用云架构的企业

当前,面对云产品的运维,企业缺乏有效的手段,主要包括数据不全、数据粒度较低时间粒度过滤维度少。其次,云产品实例数据分散,用户难以打通,客户对于ALB云产品并不熟悉,难以通过数据得到有效的性能分析,分析问题的门槛较高。

从竞品上来看,云产品主要以日志指标用量等独立数据源与查询可视化能力为主。友商提出的 storage Lens 等多以多云切入,打通了日志、计量指标等数据,聚焦在某个优势领域,如成本分析、性能诊断。

SLS 具备丰富的可观测数据源,如日志云监控的指标、云产品的计量费用中心等,还具备自研的大规模可观测数据的实时查询与分析能力。

image.png

Cloud Lens for ALB 不只是获取基础的可观测数据,而是低门槛将数据打通,关联分析并获得洞察辅助 ALB 使用的优化。数据源主要有ALB 的访问日志SLS 的指标数据。

另外,我们提供了 Cloud Lens for ALB 统一口以及 ALB 控制台实例的入口,为用户提供了访问分析、性能监控、异常检测以及自定义分析等场景化inside功能。

image.png

Lens for ALB 架构提供ALB 7层访问日志、秒级监控、指标分析、实时告警、异常自动巡检,支持集中管理账号下所有 ALB 实例与日志的采集状态。提供ALB 访问日志的实时存储、查询、分析并实时提取 PV平均延迟出入流量指标数据

同时基于智能巡检的功能提供丰富的可视化报表与异常巡检支持自定义告警配置,具备短信、邮件、语音、钉钉等多种渠道的通知能力。

image.png

Lens for ALB 的优势主要体现在以下几点:

操作简单:一站式开通中心化使用,无需关心日志收集存储的问题,开发与运维人员可以将更多的精力集中到业务开发上。可自定义配置预聚合的能力,大幅提升查询速度。

海量数据、弹性存储:阿里云负载均衡结合日志服务强大的大数据计算能力,秒级分析处理实时产生的日志,满足DevOps监控告警等实时性要求较高的场景Logstore 容量可动态伸缩,支持实例级别开通或关闭访问日志,任意设置日志的存储时间。

实时查询、智能巡检基于达摩院智能的 AIOps 算法,提供 ALB 指标自动巡检功能,有助于更快更准确发现并定位问题。

image.png

Alibaba Cloud Lens for ALB 四个模块组成,分别是接入管理模块、报警管理模块、查询分析模块以及报表中心。

image.png

接入管理模块提供 ALB 实例的全局集中管理,实例接入展示账号内所有ALB 的全局实例提供访问日志的一键开启操作。目标存储汇聚了访问日志存储的 project logstore 并支持日志存储的周期修改。

image.png

告警管理模块内置了十五条告警规则,提供基线告警、同环比告警、智能告警,涵盖了 QPS 延迟、错误率、流量等高频场景。

image.png

分析模块提供 ALB 访问日志的实时查询与分析。

报表中心提供了五大报表包含19 个实时监控数据、8个维度的秒级监控数据以及异常指标的分布。

访问概览提供 ALB 实例整体状态包括PVUV 的日环比、周环比信息等。

Demo演示

登录 SLS的控制台在日志应用云产品 Lens 的标签下,点击Cloud Lens for ALB

image.png

首先进入接入管理页面。接入管理的 ALB 实例记录中汇聚了账号下所有 ALB 实例可以进行实例的访问日志的开启等操作

点击开启后,会提供两种方式的日志存储,分别为选择已有 project 新建 project

点击列表右侧的访问日志,直达访问日志的查询页面可以直接进行日志库的查询操作。此外,也可以通过点击左侧的查询分析,选择需要的 ALB 实例进行查询。

image.png

存储目标库里汇聚了所有 ALB 开启的目标库的存储情况可以对目标的日志库进行修改数据存储时间支持自定义天数永久保存或开启智能冷热分层存储。

image.png

基于访问日志,可以在告警管理页面进行告警配置,Cloud Lens for ALB内置十五条告警规则

image.png

可以根据业务需要直接选择相应的告警规则,点击日志开启告警。开启后点击设置可以告警阈值、黑白名单等信息进行设置。

image.png

报表中心提供监控概览、监控中心秒级监控实例巡检以及访问概览五种报表。监控概览中提供了ALB 实例核心指标错误码流量以及访问 PV 访问成功率数据

image.png

监控中心提供实时的监控指标,包括访问的 PV 访问成功率流量平均延迟 top N 类的统计

image.png

秒级监控提供了 QPS 访问延迟请求流量、成功率以及各种状态码的情况

image.png

实例巡检基于 SLS 的机器学习算法提供了异常检测的数据,包括 PV 出流量以及流量。

image.png

访问概览提供了访问总体状态的查询,包括 PVUV 以及请求

相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
存储 负载均衡 调度
Docker 多主机部署:构建容器集群的最佳实践,助力高可用性与负载均衡
Docker 多主机部署:构建容器集群的最佳实践,助力高可用性与负载均衡
822 0
|
2月前
|
负载均衡 Java 对象存储
负载均衡策略:Spring Cloud与Netflix OSS的最佳实践
负载均衡策略:Spring Cloud与Netflix OSS的最佳实践
49 2
|
6月前
|
负载均衡 Kubernetes Cloud Native
云原生最佳实践系列2:基于 MSE 云原生网关同城多活
通过使用阿里云的云原生微服务引擎 MSE,可以实现注册中心的同城容灾多活微服务应用。MSE 提供了云原生网关和注册中心,支持机房级故障的秒级自动转移、非对等部署下的全局流量负载均衡以及流量精细化管控。
767 42
|
6月前
|
负载均衡 Cloud Native 安全
云原生最佳实践系列 6:MSE 云原生网关使用 JWT 进行认证鉴权
本文档介绍了如何在 MSE(Microservices Engine)云原生网关中集成JWT进行全局认证鉴权。
1010 14
|
存储 负载均衡 NoSQL
高速读写、负载均衡:基础架构KV存储项目最佳实践
高速读写、负载均衡:基础架构KV存储项目最佳实践
|
存储 运维 负载均衡
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(中)-最佳实践(2)
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(中)-最佳实践(2)
201 0
|
弹性计算 运维 负载均衡
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(中)-最佳实践(3)
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(中)-最佳实践(3)
335 0
|
弹性计算 负载均衡 Cloud Native
Soul 云原生网关最佳实践
Soul 是基于兴趣图谱和游戏化玩法的产品设计,属于新一代年轻人的虚拟社交网络。成立于2016年,Soul 致力于打造一个“年轻人的社交元宇宙”,最终愿景是“让天下没有孤独的人”。
Soul 云原生网关最佳实践
|
弹性计算 负载均衡
应用型负载均衡ALB最佳实践测评
[应用型负载均衡ALB最佳实践测评](应用型负载均衡ALB最佳实践测评) # 实验架构 **本次是使用应用型负载均衡ALB来进行典型的HTTP流量负载场景演示,下面会向您演示ALB的最佳使用方法,让您通过本篇文章掌握ALB的基础使用方法**
251 1
应用型负载均衡ALB最佳实践测评
|
域名解析 运维 负载均衡
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(中)-最佳实践(1)
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(中)-最佳实践(1)
244 0