2.3 云上大型赛事保障挑战
基于前文所总结的保障目标,结合云上大型赛事的特点,云上大型赛事保障的挑战有以下几点:
安全要求最高级
公开报道显示,从2000年悉尼奥运会开始,网络黑客就开始真正威胁到奥运会的安全举办。随着数字化技术的普及,举世瞩目的奥运会成为网络攻击的重要目标,近十年来几乎每一届奥运会所面临的网络安全威胁都是上一届的N倍。也因此,北京冬奥项目组的安全运维人员从2018年起就进驻奥组委,和其他服务商一起为冬奥设计云安全架构方案,确保奥运期间的万无一失。
业务目标多样性
客户的角色分工和业务侧重点的不同,带来每个模块的不同业务目标。例如,北京冬奥组委的核心系统涵盖30多个子信息系统,每个系统的运转都不可中断,其目标在于极强的高可用能力。源讯(Atos)的诉求则在于安全性和云服务可集成性。OBS Cloud因为其主要业务是实时的直播转播,因此对低时延非常看重。而像类似于云展厅这样的toC项目,则非常关心云服务所能提供的高并发能力。如何通过合理的架构设计和性能选择,满足复杂多样的客户目标也是云上大型赛事保障的挑战之一。
重保过程超长期
由于奥运会项目的重要性、复杂性,以及赛事的延续性,重保团队的组织能力和持续能力将受到一次全面的考验和升级。从保障体系和流程设计、资源调动和整合,到各团队之间协同配合、封网和必要业务的平衡等等,均需要全面细致的考虑,确保保障过程万无一失。
SLA高标准严要求
保证业务连续性是北京冬奥对所有技术人员的最基本要求,赛时的SLA也会写入各个技术提供商的合同中,并对超出SLA情况有详细的罚则,IOC和冬奥组委要求技术人员要像膝跳反射一样在问题发生后做出最本能的恢复业务的反应,特别是对于最高优先级的P1问题,要做到5分钟响应、1小时解决的整体SLA,这基本是业界能力天花板,对云服务商的挑战不言而喻。
超高可用性和超高性能
为了保证业务系统达到7*24的质量服务登记且不能降级,所有云架构都要经过反复的功能测试、安全测试、性能测试,通过容灾演练、技术演练的验证。并且云资源要确保有足够的弹性以应对赛时突发流量洪峰。因此,云架构方案必须重点考虑系统冗余、备份和故障恢复,保证云产品的超高可用性和超高性能。