双11阿里云技术负责人杨旭:大考亦从容

本文涉及的产品
性能测试 PTS,5000VUM额度
简介: 杨旭,花名杨曦,这是他的第六个双11。 从2012年开始,阿里云通过云计算技术为天猫双11提供计算服务。 3年前,杨旭开始作为双11阿里云技术负责人,负责搭建全球最大的混合云结构,把 “双11”的电商业务和技术场景在阿里云上实现,并保障这个混合云在双11当天能够满足全球客户的购物需求。

杨旭,花名杨曦,这是他的第六个双11。

从2012年开始,阿里云通过云计算技术为天猫双11提供计算服务

3年前杨旭开始作为双11阿里云技术负责人,负责搭建全球最大的混合云结构,把 “11”的电商业务和技术场景在阿里云上实现,并保障这个混合云在双11当天能满足全球客户的购物需求。 

11月11日晚上零点整,海量峰值如期而至,项目室里的每一个人都屏息静气的看着陡增的峰值。

几个小时以后,第一波峰值顺利度过,项目室里又恢复了喧闹。 

“每一年的双11,都是一次赶考。”杨旭一边喝可乐,一边与记者聊了起来。

72acaddbdf84a4fd00af0698bfef7c46de973011

杨曦

充分准备是成功的关键

阿里云的技术支持,早在一年前就开始准备了。去年12月中旬左右,杨旭就筹备召开了阿里巴巴的2017的双11策划会,制定了工作目标,详细每个单元的产品技术方案验证。通过多次测试以及全链路的压测,确保所有的方案和实施都能满足双11的业务需要。

在杨旭看来,这其中的每一项工作关系到今年11的阿里云表现每一项工作都是一道考题。“特别下半年压测的时候,只有那么几次机会,如果不成功可能要影响整个双11项目结果,压力大的时候,经常半夜睡不着觉,梦里都在记录解决方案。”

有一次遇到一个业务问题没解决,担心影响到双11的交易成功率,整个团队基本一个星期通宵处理问题,优化升级系统。杨旭说,为了支持这个项目,团队很多同事也都牺牲很大。压测期间,网络业务线抽调的一位同事整整48小时没有睡觉解决完问题回家,才想起2天前准备给妻子过生日的蛋糕还藏在卧室的衣柜里,打开柜门一看,蛋糕早已融化。有时候问题紧急,常常相关业务的同事半夜从家里来现场支持。“阿里云的双11团队,这是一只铁军”,杨旭感慨的说。

从2012年的最小单元验证开始,阿里云不断迭代优化,2017年,已经成长为“应用+存储+缓存+数据库+网络”的全业务上云的混合云解决方案,可以有效应对处理双11这样的脉冲计算

 1d629e1fcd946898213a33cb7a3f1dcfb49bd371

云化架构使多个数据中心像一台计算机一样来管理,可以跨多个不同的平台来调度业务发展所需的资源,构建混合云以极低成本拿到服务器,通过混合部署大幅提升资源利用率,支撑系统容量。在今年双11,阿里交易峰值再创新高达到32.5W笔/秒,这背后是靠云化架构在支撑,得以真正实现弹性资源平滑复用、任务灵活混合部署。

有了阿里云的保驾护航,杨旭表示,距离11的成功更近了一步 

谈笑间方显大将风范

早在今年9月底,杨旭就带领队伍进了阿里巴巴西溪园区的作战室。11月9日晚上20点,在1号楼阿里云的双11项目正式拉开帷幕。 

顶层的作战室里,杨旭带领着这个位于全球各地,共百余人的队伍,在双11的24小时保障视频云、图片云、电商云、金融云、物流云的正常运转 

累了,团队的同事就找个凳子,或者按摩椅睡上1-2小时,这个时候,业务部门的就会负责这块工作的其他同事顶上,保证双11期间阿里云上所有业务都有人实时盯守。 

“所有人都有人轮换,只有我是10号晚上八点进去,11号凌晨才能出来。”杨旭笑着告诉记者。“这不仅仅是阿里云的项目,更是阿里巴巴项目全国人民,甚至全球人民狂欢购物节,不能出一点差错。”。 

阿里云的能力虽然让杨旭信心十足,但今年的大考,又比往年更不容易。 

零点将至,虽然有些疲惫,但杨旭似乎越来越有信心,甚至成为了项目室情绪的调动者。

“大家11的购物车都满了吗?”杨旭的这个问题,让项目室里七嘴八舌起来。

一切似乎尽在掌握中,直到零点将至,氛围开始变得严肃起来。 

零点时分,大促正式开始,不断的有人在小声报出各个指标。 

“水位正常!”

“资源正常!”

“核心链路畅通!” 

这是最紧张的时刻,然而杨旭告诉记者。

“养兵千日,用兵一时,这个时候我是最放心的人。” 

2017年天猫双11购物狂欢节开场仅11秒交易就额破亿,3分钟突破100亿,6分钟超200亿,24小时后成交额定格于1682亿元。今年交易峰值32.5万/秒,支付峰值25.6万/秒,比去年增长超1.1倍,再次刷新全球纪录。

 e5a82215cc49318751bb24d374afbc7fe580a7da

 脉冲计算

在持续高压力冲击下,整个双11期间阿里云表现坚如磐石,各项技术指标也再次刷新世界纪录。直播支撑了4000万用户观看晚会,CDN提供80T的访问加速带宽,混合云提供了将近100万弹性计算资源调度,存储提供了340P的图片存储和2.3万亿文件,物流云全天支撑订单流转8亿+,ApsaraDB数据库最高QPS达到554万HTTPDNS在承载上千亿次日解析量的同时保持了平均10ms以下的低响应延迟……

这一串串华丽数字的背后,作为整个天猫商家的基石,阿里云是如何保障在零点洪峰来临时候稳定、安全和顺畅?

杨旭认为,优秀的产品和技术是阿里云制胜的法宝,举几个例子

直播技术:窄带高清2.0技术,用户观看质量上以360P带宽可以达到480P清晰度,480P带宽可以达到720P清晰度,同样清晰度下带宽节约30%,H.265相当比H.264为用户节约30%带宽。

计算能力:通过对虚拟化技术的优化,让极限情况下虚拟机的计算能力和物理机保持一致后续阿里云将进一步挖掘产品的计算能力。阿里云还推出了神龙服务器,通过异构计算彻底将虚拟化损耗降为0。

实例存储:通过结合SPDK+DPDK减少IO访问路径,可以将单机的IOPS提高到210w,满足大计算、重IO的高端用户场景。

CloudDBA产品:通过自动化,自助化小白诊断,实现物流云等商家的全覆盖,实现事务分析,TOP SQL,SQL Review,死锁分析等全场景自动化,无论是给客户,还是给阿里云自己都节约成本,提升用户体验。

大数据:线下推出感知零售产品,通过数据化向智能化的转变,让数据也有情感,提升新零售的转化率。

用最好的技术回馈社会

阿里云的技术每年都在突飞猛进的发展,即便作为一名资深技术人员,杨旭每年也会被新的技术、新的产品所深深震惊,比如今年双11阿里云部署网络产品,使用规模非常大,对性能的支持力度很大,这在全球也是领先的水平。

“马总说过双11是锻炼技术的。我们云上的技术方案,新技术的尝试,新的产品都会先自己验证,然后再给客户用。特别是通过全球唯一双11这种极端环境对新技术压测,还有每年多次大型活动和项目的锤炼我们的产品和技术都有最好的保证然后我们会沉淀下来,放在公有云上再提供给客户使用” 杨旭时刻谨记,阿里巴巴客户永远是第一位的。 

阿里云双11混合云架构,是全球最大的混合云架构,具备极致的弹性调度管控能力,杨旭认为,这套成功的经验可以快速满足公司国际化战略对全球资源部署的调度。 

在杨旭看来云计算不是简单的物理机虚拟化,更是一种计算和服务能力的体现,目前云上的产品大多是阿里云内部精华技术的沉淀,希望大家以一种开放的心态来用拥抱云计算,大胆尝试使用新技术,一定有意想不到的收获

正是因为每个团队在这几个月里默默的努力和不放过每一个细节,才让今年双11变成史上最轻松的双11。 

“我们不仅完美的支撑的阿里巴巴的主战场,也可以骄傲的说我们用最完美的技术支撑了全社会的狂欢,我们阿里云客户的狂欢!今年的双11,非常完美”。在11月12日凌晨2点的阿里巴巴西溪园区,连续值守52小时后杨旭顺利完成了今年双11混合云的接入和保障任务,他揉着双眼,轻松地笑着说 

技术扩展着商业的边界,商业的效率,创造着生活的美好前行,双11的技术能力,终将化为未来社会的常态。以阿里云为代表的云计算行业,也已是社会的基础设施,正如所有的超级工程一样,一个个工程师们的努力,将异想天开的想象力变成了现实。这样的故事在过去的一百年,两百年,一千年,两千年间不断发生,才让人类得以创造出任何生命都未曾创造出的奇迹,这个奇迹被人们称为:文明。

相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
云计算
阿里云业务连续性最佳实践线下沙龙 邀你参加啦!
阿里云业务连续性最佳实践线下沙龙将于12月29日于阿里巴巴西溪园区A区访客中心-204 东林书院举行,期待您的到来!
424 0
阿里云业务连续性最佳实践线下沙龙  邀你参加啦!
|
人工智能 图形学 数据中心
超27亿人参与!“云上冬奥”背后的17天
昨晚,2022北京冬奥会正式闭幕。在过去的17天里,北京冬奥会创造了冬奥会史上的最高收视率,全球超过27亿人参与了冬奥互动。
804 0
超27亿人参与!“云上冬奥”背后的17天
|
人工智能 图形学 数据中心
|
消息中间件 资源调度 容灾
7*24 小时业务不中断!菜鸟乡村应用多活落地实践
从前期调研、方案评估、多活建设到最终核心物流业务的改造上线,仅仅只用了 2 个多月,菜鸟乡村就完成了核心业务同城多活容灾的目标,实现业务的 7*24 小时不间断服务,最大程度保障了业务稳定性及连续性。
|
人工智能 运维 监控
货拉拉技术副总监陈永庭:基于公共云的技术稳定性保障实践
2021年10月22日,在云栖大会的《云上运维最佳实践》分论坛,货拉拉技术副总监陈永庭发表了主题为“基于云的货拉拉技术稳定性保障实践”的演讲,为大家分享了货拉拉在过去一段时间是如何做到技术稳定性保障的
货拉拉技术副总监陈永庭:基于公共云的技术稳定性保障实践
|
算法 双11 vr&ar
阿里员工双11云上作战 虚拟作战室玩出开会新体验
今年双11,阿里人把定胜鼓、大麦、猫头等象征着双11的元素搬到了云端,将AR模式与音视频技术结合,创新出实时动态的多人同框虚拟会议效果,让全球阿里小二能打造自己的专属作战室,与异地作战的同学一起感受双11氛围,实现云上无障碍联动作战。
2006 0
阿里员工双11云上作战 虚拟作战室玩出开会新体验
|
传感器 自然语言处理 运维
助力10万阿里小二备战双11,他们在背后都做了什么?
从光棍节变成双节棍,从一波流量洪峰变成两波。今年双11“比以往来得更早一些”,新规则不光是对前线业务小二的考验,背后的保障同学也同样面临前所未有的挑战。如何结合技术创新,在这个复杂多变的场景下,支撑业务的稳定顺滑? 为了更好帮助阿里小二们备战双11,阿里巴巴企业智能事业部打造了“双11虚拟作战室”、空中无线“光缆“、“即插即有内网”的5G盒子等一系列措施。通过数字化的技术手段,保障着10万小二的办公用网稳定与吃住行全新体验。
13237 0
助力10万阿里小二备战双11,他们在背后都做了什么?
|
双11 人工智能 关系型数据库
谁顶住双11的世界级流量洪峰?神龙架构负责人等9位大牛现场拆解阿里秘籍
今年双11,天猫成交额再次刷新世界纪录,阿里巴巴核心系统100%上云,撑住了双11的世界级流量洪峰。在这一流量战场上,阿里可谓是华山论剑的最大赢家。18日下午,神龙架构负责人旭卿、OceanBase日照、菜鸟行易等阿里9位技术大牛现身北京望京,全面解析阿里双11的武功秘籍。来新智元 AI 朋友圈和AI大咖们一起讨论吧。
|
双11 搜索推荐 算法
淘系技术,实力为2019年双11而战!稳!
2019 天猫双 11 全球狂欢节96秒成交额破百亿,24小时总成交额2684亿,创造了交易创建峰值 54.4万笔/秒的历史记录。天猫双11,已经不仅是购物节,也是品牌成长节、消费者互动节。天猫双11更是是商业的奥林匹克。每一年的双11,零点交易的数字都在不断提升,而淘系技术的突破和创新远不止与此,我们将持续以技术驱动产品和商业创新。2020,我们精彩继续!
5724 0
淘系技术,实力为2019年双11而战!稳!