你们看尽世界杯的快乐忧伤,他们负责稳定流畅

简介: 当球迷们通过网络随时随地以各种姿势享受世界杯的时候,阿里云的工程师们在背后做了哪些不为人知的努力? 当球迷们在电脑或手机上看球的时候,有一群他们看不到的人正在默默地为他们加班。这群人就是阿里云的工程师们。

当球迷们通过网络随时随地以各种姿势享受世界杯的时候,阿里云的工程师们在背后做了哪些不为人知的努力?

image

当球迷们在电脑或手机上看球的时候,有一群他们看不到的人正在默默地为他们加班。这群人就是阿里云的工程师们。中国网友观看的2018年俄罗斯世界杯直播,有70%的流量跑在阿里云上:优酷世界杯直播由阿里云提供全链路技术保障,同时,阿里云还承担了CNTV和CCTV5移动客户端的加速服务。阿里云是此次世界杯唯一同时为三家主流世界杯网络直播平台提供“护航”的公司。

看似不可能的任务

阿里云视频云团队接到优酷世界杯直播“护航”需求的时候,离开幕式已经不到两周。5月29日,优酷正式宣布成为2018年世界杯央视指定新媒体官方合作伙伴,拿到了本次世界杯的网络直播权。

接到优酷“护航”任务时,视频云团队高级技术专家穹天(花名)正在深圳出差。他赶紧回杭州,接着飞到北京,与优酷团队讨论方案。

优酷的需求是可以满足数千万用户的云服务,这意味着阿里云要帮助优酷在两周时间里把带宽能力翻一番。最终这看似不可能的任务顺利完成了——阿里云在弹性扩容方面已经拥有了充足的经验和资源。此前的央视春晚、地方台的跨年晚会、“双11”等常规活动以及像G20峰会这样在中国举办的大型活动都有阿里云团队的身影。

image

挑战不单在流量压力上。阿里云此前的“护航”项目大多集中在内容分发环节,而此次给优酷提供的则是全链路技术保障。也就是说,阿里云要为优酷提供从视频生产、处理、分发到调度的一整套技术支持。而且,以往的活动都是短期的,一天或者两三天,但世界杯持续一个月的时间——还有时差。

穹天和他的同事们设想了各种可能出现的问题,并给出周密的预案。比如,信号源出现故障怎么办,运营商网络出现故障怎么办。在十几天的时间里,阿里云视频云和优酷一起进行了不下五次的凌晨演练,他们要将各种意外情况发生的概率降到最低。“其实刚开始的时候压力还是很大的。很多东西虽然做了充分的准备,但是这种流量突增和业务模型之前没有做过,我们还是比较担心出现没想到的风险。”阿里云视频云技术专家喻义(花名)说。

所有的技术最终指向的都是用户体验

6月14日晚上八点,几十名世界杯“护航”小组的成员在杭州阿里云总部的“作战室”里等待着世界杯开幕式。“作战室”的墙上挂着写有“你们负责快乐,我们负责稳定、流畅!”的红色横幅。通过“作战室”前面放着的两块大屏幕,杭州总部的工程师们可以随时与优酷“护航”中心的“战友”们视频连线。

晚上十点半,世界杯开幕式开始了。现场的气氛有点像临考前的晚自习,有一种紧张背景色上的优哉游哉。“护航”的功夫在平时——技术积累都是在平时完成的。作为国内最大的CDN(内容分发网络)云厂商,阿里云在全球有1500个CDN节点,带宽储备高达120T+,在流量突增的场景下,阿里云的人工智能调度系统会根据负载自动调节流量。“护航”小组相当于智能系统的“看守人”。他们的职责是看系统是否按照预期工作,并在出现问题的时候及时作出反应。

image

阿里云内部一直有一个说法:他们的理想是喝着茶过“双11”。对这些互联网工程师们来说,他们一直在做让自己的工作更轻松的工作。穹天回忆,他们早期做直播护航的时候,很多工作都是“人肉做的”。逐渐地,他们通过技术的迭代把这些曾经由他们自己来做的工作都交给AI了。

所有的技术最终指向的都是用户体验。一般的网络直播都是25帧画面,此次优酷世界杯直播用了50帧画面技术。这给用户带来了更好的观看体验,也因此需要更优质的CDN支持。支撑这些的正是阿里云的技术优势。这次优酷世界杯直播使用的窄带高清技术是阿里云自行研发的,这一技术可在保证画质的基础上降低30%的流量。5月13日刚刚收官的《这!就是街舞》也使用了这一技术。

技术再好、智能程度再高,意外情况终究是要时刻警惕的——这是人的优势所在。开幕式当天,原先准备的自动调度策略就遇到了一些问题。好在有缜密的准备做后盾,出现的意外都在可控范围之内。喻义和他的十几个同事在第一场比赛结束后立即“复盘”,一直讨论到凌晨五点。讨论完,统计数据的、制定调度策略的、编程实现的,像接力赛一样,每个人都赶紧完成自己的一棒,不到七个小时后,一套更为精细化的流量调度方案上线了。当天晚上八点埃及对阵乌拉圭的比赛中就用上了新方案。

一届独特的世界杯

半个多月过去后,阿里云视频云的工程师们越来越感到接近边喝茶边“护航”的理想了。“整个模型和调度方案已经摸得非常准了。”阿里云视频云技术研发负责人文景(花名)说,系统的运行也越来越符合甚至超过预期。文景介绍,优质的用户体验还带动了优酷全网点击量的增长,这些成绩让他感到“如释重负”。

对很多阿里云工程师来说,这都是一届独特的世界杯。

世界杯开始后的第三天就是端午节假期,阿里云产品架构团队的士稚(花名)一个月前刚向女朋友求婚成功,原打算趁端午节去见丈母娘的,但因为实在脱不开身,只好把见丈母娘的时间推迟到世界杯结束之后了。

这是喻义“一生看得最多的”一届世界杯,但同时又是看得最少的,因为“虽然你在看世界杯,但你就感觉这个和你无关的。”喻义觉得,这次世界杯对阿里云整个视频云团队都是非常难得的练兵机会。他经常会和同事们说:“经历了世界杯(的锤炼)之后,我们还怕什么?”

image

对穹天来说,这也是最特别的一届。从1998年开始,他已经看了20年世界杯。但以前是在“欣赏足球比赛”,现在想的全是画质、场景切换、流量调度这些技术问题。每天值班结束,穹天都会和同事们就当天“护航”中出现的问题进行复盘。白天没有比赛的时候,他和同事们也会继续分析世界杯直播的数据,研究哪些地方可以作出改进。

前些天文景看到一则新闻,杭州一群建筑工人没有WiFi看世界杯,自己的手机流量又不够用,就大伙儿用手机“合伙”看:今天用我们俩的手机,明天再用你们两个的手机。文景“特别有感触”,从这则简短的新闻中他看到了他和同事们所做工作的价值。

本文作者:刘磊
原文链接:https://mp.weixin.qq.com/s/Y0u4-FpBk4_fBnOH5P9Esw

相关实践学习
Serverless极速搭建Hexo博客
本场景介绍如何使用阿里云函数计算服务命令行工具快速搭建一个Hexo博客。
目录
相关文章
|
机器学习/深度学习 传感器 人工智能
耗时2天,我自制了一台体感游戏机
但往前几年,其实还有另一个非常火的体感游戏设备,就是 xbox 上的 kinect。和 switch 用带有传感器的手柄来识别玩家动作不同,kinect 使用的是一组摄像头,通过图像来识别玩家的动作。
|
编解码 边缘计算 人工智能
|
人工智能 计算机视觉
|
边缘计算 运维 算法
超越感官,沉浸赛场——大型体育赛事云上实战精选-第六章 CUBA:“自由视角”的畅快赛事-5G+边缘计算+自由视角,让体育赛事更畅快
超越感官,沉浸赛场——大型体育赛事云上实战精选-第六章 CUBA:“自由视角”的畅快赛事-5G+边缘计算+自由视角,让体育赛事更畅快
223 0
|
程序员
阿云漫画 | "工作了,又仿佛没在工作"是一种什么体验
编者按: 程序员的日常大多和电脑有关,那么在等待计算机操作结束的这段时间,要如何高效利用呢?要说程序员等待编译的时候都在做神马,就不得不祭出这篇经典的漫画。
105 0
|
存储 机器学习/深度学习 NoSQL
双11大型互动游戏“喵果总动员” 质量保障方案总结
推荐语:互动游戏是一个系统化工程,在笔者的“喵果总动员”质量方案中,可以看到为保障用户体验,我们在各个难点的解决方案, 例如:用线上压测能力支持业务及时调整各服务容量、通过强化学习覆盖游戏行业的测试路径覆盖难题、利用系统异常注入发现corner case等, 都为互动游戏的系统性质量保障提供了方法。 ——大淘宝技术质量工程师 搏天
232 0
双11大型互动游戏“喵果总动员” 质量保障方案总结
|
存储 移动开发 JSON
国庆节到了,实现一个生成国庆风头像小工具,详解实现过程!
明天就是国庆节了,最近看到好多好友换了国庆风的头像,感觉这个挺有意思,就找到了类似的源码研究了一番,并进行了改造(并非原创,只是进行了改造,只要想分享一下实现思路)。下面就来看看如何实现一键生成国庆风头像小工具。​
278 0