看不见的战斗——阿里云护航世界杯直播容灾实践

简介: 1978年,中国人开始在电视机上看到世界杯, 中央电视台对阿根廷队参加的半决赛以及阿根廷和荷兰的决赛进行了录播。1982年世界杯,宋世雄坐在一家香港宾馆的小电视前进行解说,然后央视再把香港这家电视台提供的画面转到自己的频道上,这就完成了中央电视台对世界杯足球赛的第一次现场直播。

1978年,中国人开始在电视机上看到世界杯, 中央电视台对阿根廷队参加的半决赛以及阿根廷和荷兰的决赛进行了录播。1982年世界杯,宋世雄坐在一家香港宾馆的小电视前进行解说,然后央视再把香港这家电视台提供的画面转到自己的频道上,这就完成了中央电视台对世界杯足球赛的第一次现场直播。

40年后,作为历史上首家拿下世界杯直播权的主流视频平台,这次优酷直接祭出了新玩法,采取央视解说、粤语解说、优酷专属专业解说以及跨界明星等四路四种风格的解说,满足不同用户的需求。

image

当然,世界杯只是一个缩影。互联网直播相比于电视直播和其他媒体形式,用户对于观感体验的要求更高,也给各大直播平台和提供直播服务的云计算厂商带来了更多技术挑战。

相对于电视信号的同轴电缆传输,在互联网上(无线)传输有很多不确定因素。信号的稳定性、生产速度、跨地域传输效率、灾备系统等等,都是需要关注的关键性指标。

面对世界杯这一流量空前的大规模直播活动,和多路解说、超高清画质等用户丰富交互的流畅保障需求,CDN的支撑对优酷来说尤为重要。优酷的兄弟团队、国内视频服务体量最大的云计算公司阿里云派出了视频云团队,该团队曾支持天猫双十一、春晚直播等大型项目,护航经验丰富。

护航项目组负责人之一,阿里云CDN产品架构师团队喻义表示:在世界杯开始之前,团队就开始思考,直播中信号源出现故障怎么办,运营商网络出现故障怎么办以及其它意外等,项目组设想了各种可能出现的问题,并给出周密的预案。

第一,多信号源异地备份

世界杯比赛的信号源是直播的根本,信号的稳定性直接影响所有直播用户的观看体验,所以必须做多信号源的备份,阿里云采取了以下方案:

1、采用多信号源异地备份,单一地区的环境问题、网络问题、设备问题导致的故障,不会影响整体业务
2、同源信号多路复合,同来源的内容,通过多源同时拉取,智能检测判断,合并成一路高质量、高可用的复合流,降低网络因素或者单台源站导致的不稳定和质量下降
3、异源信号智能检测,自动切换。对于不同来源的信号智能检测信号质量,切换到优质信号源。

_1

第二,生产链路灾备

直播内容生产链路也至关重要,在面对如此重要,如此大规模比赛,需要从技术架构上确保万无一失。

1、组件分布式,从直播信号的上行、转码、切片、流媒体服务,任何一个环节都是多路备份,任何单台设备故障,都是秒级切换,秒级恢复。
2、网络主备,所有组件的接入网络都是多线、多出口,不会因为单一运营商,单一网络产品的故障,导致服务不可用。
3、异地容灾,在多个中心同时部署备份,极端情况下,就算整个华东中心的生产环境异常,在1分钟内,可以把业务切到华北中心,快速恢复,保证信号的正常分发。

第三,分发网络灾备

播放端(用户)从就近的L1节点完成播放,L1节点一般就是本地覆盖的边缘节点,如果机房内有这路视频流,就直接返回,如果没有,就从L2节点拉流,如果L2不命中,最终会去直播中心寻找这路流。这其中,任何的链路都会存在抖动状况,CDN会通过自动切换调度来保证稳定性。
在L2节点,会做多区域、多运营商的二级节点备份,保障任何单一地区、运营商的故障不会影响整体服务。

_2

为了确保客户业务的容灾稳定性,阿里视频云针对客户业务场景设计涵盖视频生产、视频处理、视频分发的全链路高可用高并发的方案,并在开赛前2天配合优酷和CNTV完成了多次全链路的压测和容灾演练,为整个世界杯期间的运行稳定打好基础。这中间可以看到阿里云在双11、春晚积累下来的经验,很好的赋能并输出到了另外一个更大的战场中。

除了优酷外,阿里云还支撑了CNTV、CCTV5客户端,为全网70%的世界杯直播流量提供服务。要想保障这样重大的赛事,背后的整个平台的运维保障工作就是一个没有硝烟的战场。谈到这里,喻义不禁感慨:“优酷最晚拿到直播权,这个时候距离世界杯开幕只有2周的时间。阿里云需要在这2周的时间之内,完成整个运营商资源、云化资源储备和调度、整个CDN的容灾和灾备、视频处理中心的容灾和灾备。这对我们的供应链体系和组织协同都是非常大的挑战。然而比赛到了今天,我们都圆满地完成了护航任务,成功应对了一次又一次的流量攀升。”

image

对很多阿里云工程师来说,这都是一届独特的世界杯。从小组赛到淘汰赛,伴随着每场直播的顺利进行,球迷对于高清流畅的反馈,充分验证预案是成功的。世界杯护航结束后,会有更多的挑战,等待着阿里云CDN团队来迎战,一切未完待续。

相关实践学习
Serverless极速搭建Hexo博客
本场景介绍如何使用阿里云函数计算服务命令行工具快速搭建一个Hexo博客。
目录
相关文章
|
云计算
阿里云业务连续性最佳实践线下沙龙 邀你参加啦!
阿里云业务连续性最佳实践线下沙龙将于12月29日于阿里巴巴西溪园区A区访客中心-204 东林书院举行,期待您的到来!
417 0
阿里云业务连续性最佳实践线下沙龙  邀你参加啦!
|
监控 容灾 NoSQL
【TICA大咖】大促场景下,如何保障未来玩法的功能确定性
阿里QA导读:TICA2022如期报到,将于2022年12月15日正式举办,第四次跟大家见面,我们诚意满满,期望给大家带来更多干货。从本周末开始,小编将开启【TICA大咖】频道,每周六跟大家分享TICA各会场出品人的精彩文章,本周文章来自工程效能分会场出品人-太禅老师,讲述如何通过创建隔离环境并修改系统时间,让亿级买家、千万级商品提前过双11,并观察核心交易链路上的功能可用性。
799 0
【TICA大咖】大促场景下,如何保障未来玩法的功能确定性
|
边缘计算 人工智能 视频直播
云上“视界” 创新无限 | 2022阿里云直播峰会正式上线
7月8日,2022阿里云直播峰会正式上线!
947 0
云上“视界” 创新无限 | 2022阿里云直播峰会正式上线
|
消息中间件 存储 人工智能
极速生成缩略图,Serverless 支撑赛事转播锁定冬奥亮点
阿里云函数计算(FC)支撑用户开发赛事视频截图的核心业务代码,实现了弹性高可用免运维的直播视频截图服务,满足用户开发成本低、一键部署的业务需求,比赛期间完美支撑视频转播实时锁定冬奥亮点。
极速生成缩略图,Serverless 支撑赛事转播锁定冬奥亮点
|
云安全 弹性计算 人工智能
阿里云祝顺民:云网络心智大图解读
2021 年10 月20 日,在2021 云栖大会·云计算产业升级峰会上,阿里云“因云而生”云原生心智大图正式发布,包含弹性计算、云网络、基础产品、基础设施、操作系统、云安全、开放平台等7个 IaaS 领域,以及云原生应用平台、数据库、大数据&AI、智能loT、云效平台、企业服务云、视频云、钉钉等8个 PaaS & SaaS 领域的阿里云核心技术逐一亮相,具体产品解读内容将在「凌云时刻」进行系列发布。本文根据阿里巴巴集团研究员、阿里云云网络负责人祝顺民(江鹤)的现场分享整理而成。
阿里云祝顺民:云网络心智大图解读
|
人工智能 编解码 监控
我在春晚现场护航直播
把春晚直播的信号送到千家万户。
我在春晚现场护航直播
|
编解码 双11 UED
猫晚流量再创记录,阿里云直播方案护航优酷2500万用户体验
对“剁手党而言,天猫双11早已经超越了简单的“买买买”,更是一场边看边玩的狂欢盛宴。今年的天猫双11狂欢夜晚会(简称“猫晚”)在上海举办,这台兼具年轻潮流与国际风范的“超级晚会”,通过优酷、浙江卫视、东方卫视进行了全程网络直播和电视直播,吸引了超过全球超过2.4亿人收看。
2441 0
猫晚流量再创记录,阿里云直播方案护航优酷2500万用户体验
|
数据采集 人工智能 运维
一起抗“疫”!阿里云线上精品课程免费了
2月4号,阿里云免费开放多门在线精品课程,为这股力量注入了新的能量。从阿里云云计算、大数据、云安全等ACP认证考试辅导课,到云原生技术学习、达摩院技术解析等精品课程,阿里云希望借此,助力学生停课不停学、助力Soho办公“充电”不停。
2966 0
一起抗“疫”!阿里云线上精品课程免费了
|
双11 人工智能 关系型数据库
谁顶住双11的世界级流量洪峰?神龙架构负责人等9位大牛现场拆解阿里秘籍
今年双11,天猫成交额再次刷新世界纪录,阿里巴巴核心系统100%上云,撑住了双11的世界级流量洪峰。在这一流量战场上,阿里可谓是华山论剑的最大赢家。18日下午,神龙架构负责人旭卿、OceanBase日照、菜鸟行易等阿里9位技术大牛现身北京望京,全面解析阿里双11的武功秘籍。来新智元 AI 朋友圈和AI大咖们一起讨论吧。
下一篇
无影云桌面