《阿里云可观测最佳实践》——道旅

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
应用实时监控服务-应用监控,每月50GB免费额度
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
简介: 《阿里云可观测最佳实践》——道旅

10 比邻东方

     比邻东方从零建设可观测与高可用体系


1 关于比邻东方


比邻东方作为新东方旗下独资在线外教直播公司,根据新东方23年教学体系反馈,与国际资深教材编写团队共同打造国际小学课程体系,为5~12岁中国学生量身定做国际小学3人在线外教课程。


为了响应教育部保障防控疫情期间学生“停课不停学”的号召,2020年2月,新东方快速整合集团内外优质教师资源和课程资源,面向新东方所有中小学学员推出免费的全年级全学科同步线上课程及心理课程,面向中小学生家长推出免费的家庭教育线上课程,为社会提供更多样的公益性优质学习资源,助力学生及家长在延长的假期里共同进步和成长。


2 业务场景 & 可观测需求介绍


新东方青少外教直播品牌比邻东方,2月10日晚8点开始在线选课及促销活动,预计在活动期间会有严重的流量压力。除流量压力外,还需要保证活动期间主流程的可用性及系统的稳定性。与此同时,在突发流量面前可能会遇到性能瓶颈,无法及时感知前端响应数据和应用运行数据。


3 解决方案


比邻东方大型线上公益课程的选课和促销活动之前选用了阿里云ARMS产品,阿里云技术团队从活动准备到活动结束期间,协助比邻东方进行了全方面的技术方案准备和性能压测,在此期间预测并处理了多个潜在问题,最终帮助比邻东方顺利完成活动。


l 活动倒计时32小时

比邻东方与阿里云技术团队联系,提出产品需求。技术团队协助开通ARMS产品,并确认压测方案,配置限流降级页面,安装产品探针,进行业务接口性能摸高。确认比邻东方已有系统的最高吞吐能力和整体应用响应时间。


l 活动倒计时12小时

帮助比邻东方进行多次压测,过程中修复了多个关键性能瓶颈,确认了限流降级的接口和阈值。同时系统吞吐能力与接口相应效率有了数倍提升。


l 活动开始5分钟

活动过程中,流量比预估更迅猛。通过ARMS定位关键瓶颈,迅速通过AHAS降级该请求,保证了比邻东方活动主流程的可用性及系统的稳定性。


l 活动顺利结束


4 业务价值


两天内,我们帮助比邻东方从零开始完成了压测和监控高可用的体系建设,赢得了比邻东方的信任,在在线教育高速增长的今天,提升了阿里云在新东方客户的黏性。再次证明了AHAS+PTS+ARMS是非常低门槛,对于任何有短时高并发场景的客户十分行之有效的一个解决方案。


压测保障:通过PTS压测确认系统基线能吞吐多少,通过ARMS监控和诊断压测过程中的性能瓶颈,并在上线时通过AHAS配置限流阈值保障系统稳定。


护航限流:为避免突发高并发流量影响客户业务,通过ARMS实时监控活动流量变化,通过AHAS对突发流量和意外场景进行实时限流降级,保证系统的整体稳定性。


用高可用能力的云工具产品,提供应用架构自动探测,故障注入式高可用能力评测和一键流控降级等功能,可以快速低成本的提升应用可用性。

1

相关文章
|
存储 SQL 关系型数据库
TiDB的优势:为何选择TiDB作为您的数据库解决方案
【2月更文挑战第25天】随着数据规模的不断增长和业务需求的日益复杂化,现代企业对数据库系统的扩展性、高可用以及分布式处理能力提出了更高的要求。TiDB作为一个新型的开源分布式数据库,以其独特的设计理念与卓越的技术特性,在众多数据库解决方案中脱颖而出。本文将深入剖析TiDB的核心优势,探讨其如何帮助企业从容应对海量数据挑战、实现无缝水平扩展、保障服务高可用性,并提供灵活一致的事务支持。
|
人工智能 大数据 数据中心
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
揭示Transformer周期建模缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
北京大学研究团队发现,Transformer等主流神经网络在周期特征建模方面存在缺陷,如记忆数据模式而非理解内在规律,导致泛化能力受限。为此,团队提出基于傅里叶分析的Fourier Analysis Network(FAN),通过显式建模周期性特征,提升模型的理解和预测能力,减少参数和计算量,并在多个实验中验证其优越性。论文链接:https://arxiv.org/pdf/2410.02675.pdf
207 3
|
人工智能 Prometheus 监控
面向智算服务,构建可观测体系最佳实践
面向智算服务,构建可观测体系最佳实践
138692 307
|
存储 缓存 数据可视化
链路跟踪-SkyWalking系列(二)
链路跟踪-SkyWalking系列(二)
|
监控 安全 网络协议
|
存储 机器人 数据处理
【UiPath2022+C#】UiPath 循环
循环是指根据指定条件重复执行一组操作。
【UiPath2022+C#】UiPath 循环
|
存储 数据采集 消息中间件
阿里十年技术沉淀|深度解析百PB级数据总线技术
数据总线作为大数据架构下的流量中枢,在不同的大数据组件之间承载着数据桥梁的作用。通过数据总线,可以实时接入来自服务器、K8s、APP、Web、IoT/移动端等产生的各类异构数据,进行统一数据管理,进而实现与下游系统的解耦;之后可以异步实现数据清洗、数据分发、实时计算、离线计算等计算过程,进而将结构化后的数据投递到下游的分析、归档系统,进而达到构建清晰的数据流的目的。广义上,数据采集与接入、传输链路、存储队列、消费计算、投递等都属于数据总线的范畴,整体上可以分为采集接入层、管道层、计算层。
24195 6
阿里十年技术沉淀|深度解析百PB级数据总线技术
|
算法 BI
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.2故障分体系
《云上业务稳定性保障实践白皮书》——三.故障管理体系——3.故障管理全流程——3.2故障分体系
547 0
|
Linux 数据库 索引
如何在Linux中进行本地Blast序列比对?
如何在Linux中进行本地Blast序列比对?