《阿里云可观测最佳实践》——道旅

简介: 《阿里云可观测最佳实践》——道旅

10 比邻东方

     比邻东方从零建设可观测与高可用体系


1 关于比邻东方


比邻东方作为新东方旗下独资在线外教直播公司,根据新东方23年教学体系反馈,与国际资深教材编写团队共同打造国际小学课程体系,为5~12岁中国学生量身定做国际小学3人在线外教课程。


为了响应教育部保障防控疫情期间学生“停课不停学”的号召,2020年2月,新东方快速整合集团内外优质教师资源和课程资源,面向新东方所有中小学学员推出免费的全年级全学科同步线上课程及心理课程,面向中小学生家长推出免费的家庭教育线上课程,为社会提供更多样的公益性优质学习资源,助力学生及家长在延长的假期里共同进步和成长。


2 业务场景 & 可观测需求介绍


新东方青少外教直播品牌比邻东方,2月10日晚8点开始在线选课及促销活动,预计在活动期间会有严重的流量压力。除流量压力外,还需要保证活动期间主流程的可用性及系统的稳定性。与此同时,在突发流量面前可能会遇到性能瓶颈,无法及时感知前端响应数据和应用运行数据。


3 解决方案


比邻东方大型线上公益课程的选课和促销活动之前选用了阿里云ARMS产品,阿里云技术团队从活动准备到活动结束期间,协助比邻东方进行了全方面的技术方案准备和性能压测,在此期间预测并处理了多个潜在问题,最终帮助比邻东方顺利完成活动。


l 活动倒计时32小时

比邻东方与阿里云技术团队联系,提出产品需求。技术团队协助开通ARMS产品,并确认压测方案,配置限流降级页面,安装产品探针,进行业务接口性能摸高。确认比邻东方已有系统的最高吞吐能力和整体应用响应时间。


l 活动倒计时12小时

帮助比邻东方进行多次压测,过程中修复了多个关键性能瓶颈,确认了限流降级的接口和阈值。同时系统吞吐能力与接口相应效率有了数倍提升。


l 活动开始5分钟

活动过程中,流量比预估更迅猛。通过ARMS定位关键瓶颈,迅速通过AHAS降级该请求,保证了比邻东方活动主流程的可用性及系统的稳定性。


l 活动顺利结束


4 业务价值


两天内,我们帮助比邻东方从零开始完成了压测和监控高可用的体系建设,赢得了比邻东方的信任,在在线教育高速增长的今天,提升了阿里云在新东方客户的黏性。再次证明了AHAS+PTS+ARMS是非常低门槛,对于任何有短时高并发场景的客户十分行之有效的一个解决方案。


压测保障:通过PTS压测确认系统基线能吞吐多少,通过ARMS监控和诊断压测过程中的性能瓶颈,并在上线时通过AHAS配置限流阈值保障系统稳定。


护航限流:为避免突发高并发流量影响客户业务,通过ARMS实时监控活动流量变化,通过AHAS对突发流量和意外场景进行实时限流降级,保证系统的整体稳定性。


用高可用能力的云工具产品,提供应用架构自动探测,故障注入式高可用能力评测和一键流控降级等功能,可以快速低成本的提升应用可用性。

1

相关文章
|
存储 SQL 关系型数据库
TiDB的优势:为何选择TiDB作为您的数据库解决方案
【2月更文挑战第25天】随着数据规模的不断增长和业务需求的日益复杂化,现代企业对数据库系统的扩展性、高可用以及分布式处理能力提出了更高的要求。TiDB作为一个新型的开源分布式数据库,以其独特的设计理念与卓越的技术特性,在众多数据库解决方案中脱颖而出。本文将深入剖析TiDB的核心优势,探讨其如何帮助企业从容应对海量数据挑战、实现无缝水平扩展、保障服务高可用性,并提供灵活一致的事务支持。
|
人工智能 大数据 数据中心
|
11月前
|
存储 算法 C语言
高精度算法
本文详细介绍了高精度算法的实现,涵盖加法、减法、乘法、除法及取模等操作。通过字符串与数组结合的方式,解决了大数运算中超出数据类型范围的问题。每种运算均提供完整的C++代码示例,包括输入处理、位运算模拟、进位/借位逻辑以及结果输出。其中,高精度加法和减法通过逆序存储数字简化计算;乘法利用双重循环模拟手算过程;除法分为低精度和高精度两种情况,分别采用逐位试商与减法模拟;取模则通过逐位累加求余实现。这些方法为处理大规模数值运算提供了有效工具,适用于竞赛编程与实际开发场景。
449 24
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
揭示Transformer周期建模缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
北京大学研究团队发现,Transformer等主流神经网络在周期特征建模方面存在缺陷,如记忆数据模式而非理解内在规律,导致泛化能力受限。为此,团队提出基于傅里叶分析的Fourier Analysis Network(FAN),通过显式建模周期性特征,提升模型的理解和预测能力,减少参数和计算量,并在多个实验中验证其优越性。论文链接:https://arxiv.org/pdf/2410.02675.pdf
360 3
|
监控 安全 数据安全/隐私保护
什么是访问控制服务?
【8月更文挑战第31天】
434 0
|
算法 Python
打造高效生产排程:Python在APS解决方案中的应用
打造高效生产排程:Python在APS解决方案中的应用
876 2
|
存储 机器人 数据处理
【UiPath2022+C#】UiPath 循环
循环是指根据指定条件重复执行一组操作。
【UiPath2022+C#】UiPath 循环
|
应用服务中间件 Shell 数据库
Docker 容器间通信
Docker 容器间通信
526 1
|
消息中间件 存储 Kafka
【附下载】实时数仓架构设计与选型
【附下载】实时数仓架构设计与选型