云上中国年,新春不打烊。和往年一样,2018年“云上中国年” 看阿里云如何护航客户春节高峰业务。
刚刚度过的这个春节,互联网仍旧是最热闹的地方。从多个指标来看,这个春节创下了多个互联网历史新高。
互联网时代的春节,云计算都发挥了怎样的作用呢?作为全球3A、亚洲第一大的云计算公司,服务着百万用户的阿里云又与客户协力为不打烊的春节做了哪些事呢?
弹性扩容上万台,春节时微博的坚守
据微博数据显示,今年除夕期间,微博活跃用户高达2.2亿。春晚直播期间,网友发布了7500多万条讨论春晚的微博,互动量达2.1亿,最热话题#春晚#新增阅读量65亿。此外,“中国赞”活动共获全民点赞20.58亿次。
除夕当天,微博支撑了巨大的访问流量,使用阿里云弹性扩容上万台,堪称国内公共云规模之最。在此次春节应对解决方案中,云产品使用规模增加到去年的三倍,分别在三个可用区共计部署数万台ECS,使用专线带宽数百GB,还使用了负载均衡、OSS、CDN、高速通道、NAT网关、DDoS高防等产品。
以往微博采用的是混合云架构,经专线连接阿里云服务,并最终通过微博自有IDC对外提供服务,今年微博首次尝试在阿里云建设公网入口,即有一部分用户请求直接通过阿里云的微博服务完成。在高流量访问时期,保持DDoS攻击的鉴别,对有效访问请求进行响应。
在春晚大考之前进行了两次模拟测试开通虚拟机,微博的诉求是扩容速度尽可能快,VM创建时间短且成功率高,VM利用率高以节约成本。阿里云护航服务团队制定了三个可用区的扩容计划,实现千台规模的分钟级扩容,评估及制定了更合理的API阈值,最终效果超出预期。
应微博要求,阿里云护航服务团队进驻微博现场保障,现场应对紧急需求。
此外,微博已经开始深度学习的应用,使用阿里云GPU和阿里云容器服务对异构计算统一管理和调度,针对性地优化分布式训练场景以提高整体集群使用效率,还因内置支持深度学习框架而提升了大规模算法的上线速度。
陪伴三十载,春晚云上直播的惊喜
央视春节联欢晚会已经陪伴华人三十余载,央视网也会同时播放春晚盛会,为此使用了阿里云的直播时移、ECS、CDN、负载均衡、NAT网关、云数据库Redis等产品。直播时移则是一种点播和直播想结合的能力,简单而言,支持对直播过的内容回看,在网络电视、网络直播中非常常见。这个功能通过结合播放器SDK和若干个接口调用而实现。
此外,央视网还面临着盗链的难题,会有人尝试破解直播,因此这还是一场网络安全的攻防战,需要在各项规定限制下使用技术手段与网络黑产分子斗争。针对此场景,客户使用了阿里云提供二次鉴权支持、DRM加密内容支持、自定义码率降级等技术支持。
全球直播,情系全球华人的芒果TV
“文化中国·四海同春”2018全球华侨华人春节大联欢于大年初一浓情上演,芒果TV全程同步播出。晚会高规格情怀加接地气元素,完美融合了浓郁的游子思乡情。国内外一线大咖纷纷加盟,希望可以为全球的华侨华人送去新春盛典。而芒果TV本次播出不仅全免费开放,还采用了弹幕留言、投票、送礼等多种互动方式,并通过Facebook和YouTube与全球华侨华人共享。
因此预计今年并发访问用户将剧增,有计算资源和网络带宽的增加需求。芒果TV共使用了CDN、ECS、弹性伸缩ESS、专有网络VPC、负载均衡SLB、对象存储OSS、日志服务、EDAS、云数据库RDS、云数据库Redis、DRDS、云解析、高速通道共13款云产品。
ECS + 负载均衡SLB支撑上百万并发用户播放器访问和弹幕推送显示;而弹幕发送、送礼和投票则还需要数据库RDS、Redis、DRDS和互联网中间件EDAS。其中阿里云云数据库RDS可以存放核心数据,受到全面的安全体系保护,有白名单、数据加密、专有网络隔离、行为审计以及服务授权全链路保护用户数据的安全,目前RDS已全面通过等保三级国家标准,金融云部分更是达到等保四级要求。
CDN是为了保障芒果TV移动端、PC端和OTT端的顺畅流出。一般而言,视频点播业务对播放质量要求非常高,对卡顿率和错误率指标有严格要求;而活动类直播会有负载瞬间升高的情况。以CDN为例,前一种场景需要高性能和高稳定性,阿里云CDN全球1200+节点分布,具有85Tbps的带宽储备,通过CDN的弹性计算和动态资源配置可以有效平衡网络的流量分布,最优化利用资源应对流量;后一种还需要具备足够带宽和强大的视频流转码能力,CDN可以高清、高速、高效转码,通过阿里独家的窄带高清技术实现顺畅直播。
在实际落地中还有很多细节问题,比如:多样终端播放设备对视频处理方式不同,需要多码率转码等适配方式;没有客户端播放质量反馈模块,需要通过CDN的质量监控系统快速发现并处理用户播放区域的质量问题。
移动视频,炫一下
一下科技主攻移动视频领域,旗下有秒拍、小咖秀、一直播等产品。
2017年12月31日,一直播负责了五月天跨年演唱会,活动全程App平稳无异常。今年2月初还举办了2017“放肆一下”移动视频风云盛典,App直播是通过flv流和网页分享页。同时黄金十秒答题活动在盛典结束后迎来答题人数的最高潮。盛典活动是直播加点播的形式,整体方案中有阿里云云数据库Memcache、CDN、高防IP、负载均衡SLB、ECS、云数据库RDS、云数据库Redis。
针对一下科技的活动,阿里云服务护航团队做出了一些重要改造。以云数据库Memcache为例,将产品架构改为32节点特殊规格以应对高流量、高连接数和高IOPS,并将所有分片都迁移到万兆网卡的新机型从而避免物理硬件的影响。而为了保障推流链路的稳定性和可控性,还优化了CDN推流调度节点和上行架构、并增加海外覆盖。
护航项目的机制保障——阿里云服务工程师团队
护航上述的几个重大项目的是阿里云服务工程师团队。这是阿里云为客户提供的定制化服务团队。
在项目确定之后,他们会在项目前期拜访客户,明确客户业务目标、深入理解云上业务架构、并给出专业性建议与风险点评估(包含云资源容量规划与评估、容灾建议、紧急预案、安全建议等)。同时负责护航进度、多团队协调等项目管理工作;除了日常技术支持外,还为客户提供7*24小时远程或现场驻场的支持服务。
早在2010年,当IT界对云计算不明觉厉时,阿里云就大胆预测:“云计算未来将向水电煤一样成为大IT行业的基础设施,为公众提供运算服务。” 如今,云计算已经7*24*365全年无休地为各行各业提供技术支撑。