3. 某客户暑期直播课活动护航
客户是少儿编程教育行业的领导者,是一家专注提升青少年素质的科技公司,始终致力于以科技手段促进编程教育,通过人工智能、自适应学习等先进技术、科学的教育方法,实现规模化因材施教,“启发中国孩子的学习力”。
采用 AI 人机双师教学模式与十级进阶教学体系,帮助孩子收获学习兴趣,锻炼编程技能,同时养成良好思维习惯。
• 活动背景
客户在暑期举办了一次直播课活动,暑期直播活动是客户每年最重要的活动之一, 而且相比其他活动在线人数最高,预计到课人数 70w+,活动前压测在线人数 100w+。活动涉及多个业务部门,届时需要云资源高质量保障,涉及包括 ECS,OSS,Polardb, CDN,ACK,网络等多个云产品的重保护航。
阿里云提前组织各产品团队进行资源预留、参与并监控压测数据,同时制定了故障应急预案,保障客户的活动能顺利进行。活动进行中有两次流量高峰,分别是活动开始学生到课和提交作业,并发都突破 60w,阿里云监控后台数据均在预计范围内,由于提前做了资源预留,没有触发限流等突发问题。
• 活动时间
在收到客户通知需要对直播课活动护航,第一时间建立了专项护航客群和内部沟通群,方便有效沟通,及时同步活动进展以及重点问题处理进度。提前一周与客户沟通并一起评估需要后台预留的资源项。活动具体时间,护航持续时间,峰值时间区间为 7 月 17 日 19:00~21:00,峰值时间 19:30~19:40。
• 预计在线访问人数
与客户沟通了活动预计访问人数,并发请求、访问方式,例如:下载、HTTP、HTTPS请求等。活动前预测在线学生 60W+。产品范围了解了本次活动涉及到的重要云产品为 ECS、OSS、CDN 等。此次活动客户自保留了一部分资源冗余和配置了弹性扩容。网络带宽评估不会突破已购的峰值。
• 资源保障
整理了各产品需要预留的资源量后联系了各产品接口人,为相应的产品资源后台做专项申请和预留,这一步很重要,护航人员期间关注了后台审批进度,保证在活动开始前调整完成并反馈了客户。
• 活动监控
活动期间主动监控了各产品的资源水位,发现异常现象及时内部同步做了处理,处
理后同步了客户侧,监控工具整理如下:OSS 数据读写频率监控示意图。
域名流量监控示意图
• 护航总结
活动时间 19:00~21:00,峰值 19:30~19:40,在线人数峰值 60w+,期间主动监控直播域名节点水位正常,服务器 CPU 使用率平均 75%,网络流量水位未突破阈值,工程师做了全天值守护航,无突发问题。直播活动的顺利进行对客户业务推广、品牌宣传都有重要意义。