6.2 北京冬奥稳定性治理实践
通过以上稳定性原则及智能巡检工具,北京冬奥核心系统上云的业务场景也成为了我们的思想及工具的锤炼场,将稳定性治理转化为前置主动方。
6.2.1 核心系统上云架构--稳定性治理实践
在冬奥中,我们根据上述的设计原则对核心系统上云架构进行了设计和评估。
根据异地多活原则,制定了核心系统上云的架构设计(同城双可用区三机房异地容灾),欧洲项目群多region多AZ容灾方案。
根据N+1原则,针对识别出LiveCloud视频传播项目单点架构风险,并做好充足的预案准备。
根据水平扩展原则,在某核心系统容器集群中建议配置水平伸缩HPA组件,避免流量高峰的瓶颈问题。
根据自我保护原则,安全层面配置蜜罐捕获,获取攻击行为及情报,以此进行溯源反制。
图:蜜罐访问趋势图
经过上述治理,我们不仅对整体系统的架构进行了调优,同时让大型赛事核心系统在云上的架构加更稳定,为后续赛时0故障奠定了良好的基础。