【云栖号案例 | 教育与科研机构】比邻东方上云 从零开始完成压测和监控高可用体系建设

本文涉及的产品
性能测试 PTS,5000VUM额度
应用实时监控服务-用户体验监控,每月100OCU免费额度
应用实时监控服务-应用监控,每月50GB免费额度
简介: 比邻东方在活动期间有流量压力,需要保证主流程的可用性及系统的稳定性。通过PTS压测确认系统基线能吞吐多少,配置限流阈值保障系统稳定。

云栖号案例库:【点击查看更多上云案例】
不知道怎么上云?看云栖号案例库,了解不同行业不同发展阶段的上云方案,助力你上云决策!

公司介绍

新东方教育科技集团,由1993年11月16日成立的北京新东方学校发展壮大而来,目前集团以语言培训为核心,拥有短期培训系统、基础教育系统、文化传播系统、科技产业系统、咨询服务系统等多个发展平台,是一家集教育培训、教育产品研发、教育服务等于一体的大型综合性教育科技集团。新东方教育科技集团于2006年9月7日在美国纽约证券交易所成功上市,成为中国大陆首家海外上市的教育培训机构。

比邻东方是新东方旗下独资在线外教直播公司,根据新东方23年教学体系反馈,与国际资深教材编写团队共同打造国际小学课程体系,为5~12岁中国学生量身定做国际小学3人在线外教课程。

为了响应教育部保障防控疫情期间学生“停课不停学”的号召,2020年2月,新东方快速整合集团内外优质教师资源和课程资源,面向新东方所有中小学学员推出免费的全年级全学科同步线上课程及心理课程,面向中小学生家长推出免费的家庭教育线上课程,为社会提供更多样的公益性优质学习资源,助力学生及家长在延长的假期里共同进步和成长。

业务痛点

  • 新东方青少外教直播品牌比邻东方,2月10日晚8点开始在线选课及促销活动,预计在活动期间会有严重的流量压力。
  • 除流量压力外,还需要保证活动期间主流程的可用性及系统的稳定性。
  • 比邻东方尚未使用阿里云高可用系产品,在突发流量面前可能会遇到性能瓶颈,无法及时感知前端响应数据和应用运行数据。

解决方案

比邻东方大型线上公益课程的选课和促销活动之前选用了阿里云ARMS产品,阿里云技术团队从活动准备到活动结束期间,协助比邻东方进行了全方面的技术方案准备和性能压测,在此期间预测并处理了多个潜在问题,最终帮助比邻东方顺利完成活动。

  • 活动倒计时32小时
    比邻东方与阿里云技术团队联系,提出产品需求。技术团队协助开通ARMS产品,并确认压测方案,配置限流降级页面,安装产品探针,进行业务接口性能摸高。确认比邻东方已有系统的最高吞吐能力和整体应用响应时间。
  • 活动倒计时12小时
    帮助比邻东方进行多次压测,过程中修复了多个关键性能瓶颈,确认了限流降级的接口和阈值。同时系统吞吐能力与接口相应效率有了数倍提升。
  • 活动开始5分钟
    活动过程中,流量比预估更迅猛。通过ARMS定位关键瓶颈,迅速通过AHAS降级该请求,保证了比邻东方活动主流程的可用性及系统的稳定性。
  • 活动顺利结束

上云价值

两天内,我们帮助比邻东方从零开始完成了压测和监控高可用的体系建设,赢得了比邻东方的信任,在在线教育高速增长的今天,提升了阿里云在新东方客户的黏性。再次证明了AHAS+PTS+ARMS是非常低门槛,对于任何有短时高并发场景的客户十分行之有效的一个解决方案。

  • 压测保障:通过PTS压测确认系统基线能吞吐多少,通过ARMS监控和诊断压测过程中的性能瓶颈,并在上线时通过AHAS配置限流阈值保障系统稳定。
  • 护航限流:为避免突发高并发流量影响客户业务,通过ARMS实时监控活动流量变化,通过AHAS对突发流量和意外场景进行实时限流降级,保证系统的整体稳定性。

相关产品

  • 性能测试 PTS

PTS(Performance Testing Service)是面向所有技术背景人员的云化测试工具。有别于传统工具的繁复,PTS以互联网化的交互,提供性能测试、API调试和监测等多种能力。自研和适配开源的功能都可以轻松模拟任意体量的用户访问业务的场景,任务随时发起,免去繁琐的搭建和维护成本。更是紧密结合监控、流控等兄弟产品提供一站式高可用能力,高效检验和管理业务性能。
更多关于性能测试 PTS的介绍,参见性能测试 PTS产品详情页

  • 应用实时监控服务 ARMS

应用实时监控服务 (Application Real-Time Monitoring Service,简称ARMS)是一款应用性能管理产品,包含前端监控,应用监控和Prometheus监控三大子产品,涵盖了浏览器、小程序、APP、分布式应用和容器环境等性能管理,能帮助您实现全栈式的性能监控和端到端的全链路追踪诊断, 让应用运维从未如此轻松高效。
更多关于应用实时监控服务 ARMS的介绍,参见应用实时监控服务 ARMS产品详情页

  • 应用高可用服务 AHAS

应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的云工具产品,提供应用架构自动探测,故障注入式高可用能力评测和一键流控降级等功能,可以快速低成本的提升应用可用性。
更多关于应用高可用服务的介绍,参见应用高可用服务产品详情页

【云栖号在线课堂】每天都有产品技术专家分享!
在线课堂地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
存储 NoSQL Java
高可用mongodb集群(分片+副本):性能测试
高可用mongodb集群(分片+副本):性能测试
690 0
|
3月前
|
缓存 Java 测试技术
谷粒商城笔记+踩坑(11)——性能压测和调优,JMeter压力测试+jvisualvm监控性能+资源动静分离+修改堆内存
使用JMeter对项目各个接口进行压力测试,并对前端进行动静分离优化,优化三级分类查询接口的性能
110 10
谷粒商城笔记+踩坑(11)——性能压测和调优,JMeter压力测试+jvisualvm监控性能+资源动静分离+修改堆内存
|
7月前
|
存储 缓存 中间件
高可用之全链路压测
【2月更文挑战第30天】全链路压测是提升系统可用性的关键方法,它模拟真实流量和业务场景在生产环境中测试,确保性能、容量和稳定性。
|
7月前
|
消息中间件 Web App开发 监控
mqtt数据问题之如何实现webRTC 协议的监控视频压测
MQTT协议是一个轻量级的消息传输协议,设计用于物联网(IoT)环境中设备间的通信;本合集将详细阐述MQTT协议的基本原理、特性以及各种实际应用场景,供用户学习和参考。
129 0
|
SQL 存储 监控
使用AWR监控Oracle性能测试
这个 SQL 语句显示快照每小时采集一次,采集的数据保留 8天。要修改设置 – 例如,快照时间间隔为 30 分钟,保留时间为30天 ,可以发出以下命令。参数以分钟为单位。
128 1
|
存储 SQL 数据采集
性能测试知识科普(七):监控能给你带来什么
当然这些指标是我们日常工作中经常遇到和会关注的,但实际上在性能测试过程中,要根据不同的业务场景、技术架构以及问题表现来关注分析不同的指标。而不是只关注自己看到的指标,填充到表格里提交一份所谓的压测报告就完事的。
性能测试知识科普(七):监控能给你带来什么
|
存储 SQL 缓存
全链路压测(13):高可用和性能优化
业务场景复杂化、海量数据冲击下,发现并解决业务系统的可用性、扩展性以及容错性问题。
全链路压测(13):高可用和性能优化
|
Prometheus 监控 数据可视化
性能测试监控平台:influxdb+grafana+jmeter
性能测试工具jmeter自带的监视器对性能测试结果的实时展示,在Windows系统下的GUI模式运行,渲染和效果不是太好,在linux环境下又无法实时可视化。
性能测试监控平台:influxdb+grafana+jmeter
|
存储 监控 Linux
Linux下安装配置Grafana压测监控服务-配置JMeter后端监听器
Linux下安装配置Grafana压测监控服务-配置JMeter后端监听器
|
Prometheus 监控 数据可视化
Linux下安装配置Grafana压测监控服务-安装Grafana
Linux下安装配置Grafana压测监控服务-安装Grafana