《阿里云可观测最佳实践》——道旅

本文涉及的产品
应用实时监控服务-用户体验监控,每月100OCU免费额度
应用实时监控服务-应用监控,每月50GB免费额度
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
简介: 《阿里云可观测最佳实践》——道旅

10 比邻东方

     比邻东方从零建设可观测与高可用体系


1 关于比邻东方


比邻东方作为新东方旗下独资在线外教直播公司,根据新东方23年教学体系反馈,与国际资深教材编写团队共同打造国际小学课程体系,为5~12岁中国学生量身定做国际小学3人在线外教课程。


为了响应教育部保障防控疫情期间学生“停课不停学”的号召,2020年2月,新东方快速整合集团内外优质教师资源和课程资源,面向新东方所有中小学学员推出免费的全年级全学科同步线上课程及心理课程,面向中小学生家长推出免费的家庭教育线上课程,为社会提供更多样的公益性优质学习资源,助力学生及家长在延长的假期里共同进步和成长。


2 业务场景 & 可观测需求介绍


新东方青少外教直播品牌比邻东方,2月10日晚8点开始在线选课及促销活动,预计在活动期间会有严重的流量压力。除流量压力外,还需要保证活动期间主流程的可用性及系统的稳定性。与此同时,在突发流量面前可能会遇到性能瓶颈,无法及时感知前端响应数据和应用运行数据。


3 解决方案


比邻东方大型线上公益课程的选课和促销活动之前选用了阿里云ARMS产品,阿里云技术团队从活动准备到活动结束期间,协助比邻东方进行了全方面的技术方案准备和性能压测,在此期间预测并处理了多个潜在问题,最终帮助比邻东方顺利完成活动。


l 活动倒计时32小时

比邻东方与阿里云技术团队联系,提出产品需求。技术团队协助开通ARMS产品,并确认压测方案,配置限流降级页面,安装产品探针,进行业务接口性能摸高。确认比邻东方已有系统的最高吞吐能力和整体应用响应时间。


l 活动倒计时12小时

帮助比邻东方进行多次压测,过程中修复了多个关键性能瓶颈,确认了限流降级的接口和阈值。同时系统吞吐能力与接口相应效率有了数倍提升。


l 活动开始5分钟

活动过程中,流量比预估更迅猛。通过ARMS定位关键瓶颈,迅速通过AHAS降级该请求,保证了比邻东方活动主流程的可用性及系统的稳定性。


l 活动顺利结束


4 业务价值


两天内,我们帮助比邻东方从零开始完成了压测和监控高可用的体系建设,赢得了比邻东方的信任,在在线教育高速增长的今天,提升了阿里云在新东方客户的黏性。再次证明了AHAS+PTS+ARMS是非常低门槛,对于任何有短时高并发场景的客户十分行之有效的一个解决方案。


压测保障:通过PTS压测确认系统基线能吞吐多少,通过ARMS监控和诊断压测过程中的性能瓶颈,并在上线时通过AHAS配置限流阈值保障系统稳定。


护航限流:为避免突发高并发流量影响客户业务,通过ARMS实时监控活动流量变化,通过AHAS对突发流量和意外场景进行实时限流降级,保证系统的整体稳定性。


用高可用能力的云工具产品,提供应用架构自动探测,故障注入式高可用能力评测和一键流控降级等功能,可以快速低成本的提升应用可用性。

1

相关文章
|
运维 监控 Cloud Native
云原生网关可观测性综合实践
云原生网关可观测性综合实践
|
存储 运维 监控
课时1:云原生可观测最佳实践
课时1:云原生可观测最佳实践
|
存储 数据采集 运维
《阿里云可观测最佳实践》——9.道旅
《阿里云可观测最佳实践》——9.道旅
161 0
|
存储 Prometheus 监控
《阿里云可观测最佳实践》——阿里云可观测解决方案介绍
《阿里云可观测最佳实践》——阿里云可观测解决方案介绍
450 0
|
运维 Prometheus 监控
《阿里云可观测最佳实践》——阿里云可观测产品介绍
《阿里云可观测最佳实践》——阿里云可观测产品介绍
457 0
|
弹性计算 Kubernetes 监控
《阿里云可观测最佳实践》——1.深绘智能(下)
《阿里云可观测最佳实践》——1.深绘智能(下)
274 0
|
SQL 人工智能 机器人
《阿里云可观测最佳实践》——1.深绘智能(上)
《阿里云可观测最佳实践》——1.深绘智能(上)
260 0
|
监控 前端开发 UED
《阿里云可观测最佳实践》——5.映客直播
《阿里云可观测最佳实践》——5.映客直播
143 0
|
运维 监控
《阿里云可观测最佳实践》——2.叫叫阅读(下)
《阿里云可观测最佳实践》——2.叫叫阅读(下)
168 0
|
SQL 弹性计算 监控
《阿里云可观测最佳实践》——2.叫叫阅读(上)
《阿里云可观测最佳实践》——2.叫叫阅读(上)
261 0