开发者社区> 问答> 正文

业务团队大促保障的一般流程是什么?

业务团队大促保障的一般流程是什么?

展开
收起
zxynnn 2022-05-10 12:19:46 556 0
1 条回答
写回答
取消 提交回答
    1. 明确本次大促的作战地图,明确时间节点和步骤;2. 输入活动玩法和节点,明确关键时间点和GMV目标、单量峰值;3. SRE产出备战报告,其中包括保障目标,大促保障时间节奏,作战地图,流量地图(如果已经绘制出来的话),资源规划地图,业务新的变化和技术的挑战,上下游链路依赖图,核心风险和专项分工(精确到人和完成时间),同时SRE要指定监控、压测、演练、预案专项负责人(leader要为SRE放权和背书)。4. SRE绘制流量地图,明确接口流量,模块链路,关键风险。5. SRE和开发同学共同梳理上下游接口依赖流量和峰值,给出限流阈值并沟通上下游;6. 开始链路梳理,一般由熟悉业务和系统的开发同学梳理,然后拉上上下游、梳理同学、测试同学、SRE、leader一起review,review时,SRE要产出5个点:强弱依赖、风险点、限流、降级预案、新业务特征;7. 根据梳理出来的风险点展开集中治理,大的风险点要开专项治理,这一阶段要全员听调,风险点要各自去做,SRE只负责把控全局、跟踪进度、验收结果。8. 治理完成后,开展监控走查,更新监控大盘,建议由SRE指定监控专人负责;9. 压测开始前配置限流,压测过程中还要不断根据情况调节限流值;10. 开始压测,分为专项重点压测(一般单接口、单机),上下游压测,全链路压测,建议由SRE指定压测责任人;11. 录入预案,并对预案进行测试和验证,拉上业务、产品、测试一起,组织预案演练,验证预案可行性,要求业务方知晓预案执行后的影响。建议由SRE指定预案和演练责任人。12. 上述过程中都要记录未完成点和check点,在大促前,要对checklist 逐项check;13. 产出作战手册,包括值班表,工具清单,大促期间作战流程(精确到分钟级的操作时间点和人员),再次通知业务侧相关预案的影响。14. 大促开始前一天,SRE要进行战前宣讲,一般包括大促期间发布流程、审批流程、白名单人员名单,工单汇报方法,大促交流群,大促期间的红线和注意事项。15. 大促结束后,要进行复盘,复盘内容包括:目标是否达到,大促期间达到系统指标、单量,系统、业务的能力亮点,大促保障期间大家做的工作汇总,保障期间的产出亮点,后续action项,未来保障的思考和计划。
    2022-05-10 12:26:51
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
云上业务稳定性保障实践白皮书 立即下载
数据运营系统实现方案浅析 立即下载
AIOps在业务运维的最佳应用实践 立即下载