支撑双11双12的那条“神龙”,经历了几代升级?

简介: 性能普遍提升2-3成,RT大幅下降,业务丝般顺滑——这是神龙在2019双11大促的概括性表现。 2019年双11期间,神龙”扇动两翼“,充分发挥出两大优势。第一大优势,神龙实现了虚拟化卸载,以高负载压力下某电商应用为例,凭靠神龙,该应用实现30%的QPS上升、以及96.3%的RT下降。

本文来自云栖社区合作伙伴“CSDN”,了解相关信息可以关注“CSDN”
原文标题《神龙神龙你擦亮眼,阿里巴巴要“上天”》

条漫设计 | 付费下载自稿定设计
条漫文案/正文 | 胡巍巍
PPT | 阿里云王志坤
出品 | CSDN(ID:CSDNnews)

1
2
3
4
5
6
7

神龙在双11大促的表现

8

性能普遍提升2-3成,RT大幅下降,业务丝般顺滑——这是神龙在2019双11大促的概括性表现。
2019年双11期间,神龙”扇动两翼“,充分发挥出两大优势。第一大优势,神龙实现了虚拟化卸载,以高负载压力下某电商应用为例,凭靠神龙,该应用实现30%的QPS上升、以及96.3%的RT下降。第二大优势,神龙实现了物理网络、存储和计算的完全解耦,从而避免资源争抢。

神龙因何而诞生?

故事的起源,要从弹性计算开始。
2014年开始,阿里在双11大促中,开始使用公共云,即把大促的峰值流量,引入到公共云来承载,这种方式就叫弹性计算。

9

这里不得不提阿里云的云原生改造改造。几年前的阿里云,已经完成基于云的云原生改造。但这些改造,共同发挥效率时,开销会非常大。
2016年,现任阿里巴巴集团CTO张建锋(花名行癫),在当年的内部技术复盘会上说,如果要使用公有云,那么云计算的性能损耗能否成为零?
当时技术团队有点打嘀咕,因为他们感觉以当时的技术而言,云一定是有性能损耗的。军令如山,收到任务的技术团队,还是做出了行癫想要的。
今天阿里用的公有云,不仅没有虚拟化性能损耗,而且适应性更好。这其中,用到的“神器”便是阿里巴巴自研的神龙云服务器架构(以下简称“神龙”)。
神龙,是阿里云在过去两年间,一直面向的一个场景,也是阿里自研的软硬融合虚拟化的一个体系。
阿里云认为,在纯软件技术方面,行业已经把能做的技术,都做到极致了,但却仍会遇到很多挑战。
因此他们选择以软硬融合的方式来做神龙。截至目前,神龙已经发展到第三代。

10

神龙一代:虚拟机的体验,物理机的性能

2016年底,神龙开始立项。2017年10月,第一代神龙服务器发布。神龙一代,用一句英文来描述,它就是One Card for Everything,它还是裸金属虚拟化的先行者。
它不仅能提供类虚拟机管理接口,还能像管理虚机一样管理物理机,其具备的自研神龙芯片,可实现超高速IO,并能提供虚拟机存储和网络接口。
此外,神龙一代还拥有芯片加速的IO引擎,可以无缝接入VPC网络、EBS存储,还支持从镜像启动,并能实现快速交付。
一言以蔽之,神龙一代拥有超越物理机的性能和虚拟机的体验。

神龙二代:技术融合、资源并池

在研发第二代神龙时,技术团队已经对于某些产品形态,完成了从0到1的转变。
神龙的新目标,是让拿到的每一份资源,都没有任何性能损耗。
第二代神龙,发布于2018年9月,它是融合虚拟化的践行者,它具备技术融合和资源并池的功能,一套软硬件,就可以实现三种服务:即裸金属服务器、虚拟机服务和容器服务。
归纳来说,神龙二代,有三大优势。
第一,超轻薄,它的内存小于1MB/VM,CPU小于0.1%;
第二,超平稳,几乎零抖动,计算平稳性达到99.9999%,这几乎接近物理机的调度延迟;
第三,超平滑,神龙二代可以兼容原有KVM架构,并实现虚拟机互迁移。

神龙三代:性能极致,安全增强

2018年神龙二代发布之后,阿里云越来越显著地感受到互联网的变革、以及云原生时代的到来。
云原生时代到来以后,整个云端资源交付界面,都已发生变化。在云原生时代,你可能会用EVS来管理资源。
过去,你可能还得申请一个两核、四核、甚至八核的VM。今天,你只需拥有一个子机、一台母金属,上面就会呈现出你的KVS和上百个容器。
这时,所有的资源,都由你自己掌控。但是,这也给神龙,提出了更高挑战。
2018年下半年,在研发神龙三代时,阿里团队在整个底层IO层面,把所有的东西全部压缩,同时给硬件做了更多提升,这使得IO的合理性和稳定性更好。
2019年9月,暌违一年,神龙三代终于发布。
迭代三次的神龙,已经能让芯片实现IO引擎,还可实现硬件级QoS管理,并拥有增强型融合网络,也能实现2x50GbE双上联网络。此外,其还拥有增强型硬件列队。

每一寸时光,都不会白费

人种的是什么,收的就是什么。
今天的神龙,已经被定义为面向云原生时代的弹性产品。
回望过去三年,这或许是一段备受煎熬的雕刻时光。
一位位程序员,就像工匠一样,拿起小锤一笔笔刻画着神龙的鳞片。
也因此,双11的追光灯,注定会打在他们身上。
人生短短几十年,打工也好,创业也好,总得有能拿出手的作品。
这个作品,可能是你曾开发的软件、参与的项目、拿下的单子......
总之,生而为人,你得创造点什么。

目录
相关文章
|
供应链 Cloud Native NoSQL
今年双11,全面深度用云!
今年双11,全面深度用云!
82 0
|
双11
《九年双11云化架构演进和升级,打造更加完美的双11》电子版地址
九年双11云化架构演进和升级,打造更加完美的双11
79 2
《九年双11云化架构演进和升级,打造更加完美的双11》电子版地址
|
供应链 Cloud Native NoSQL
今年双11,全面深度用云
在2022天猫双11技术分享中,阿里CTO程立表示,今年是阿里首个全面深度用云的双11。云计算释放出巨大的技术红利,让双11更敏捷、更经济、更绿色。
254 0
今年双11,全面深度用云
|
新零售 存储 运维
函数计算助力世纪联华平滑支撑双11大促
世纪联华是一家门店超过 170 余家,具备全国网点布局,在快速消费品连锁零售行业具备领先地位的新零售连锁超市。经过 10 年的发展,业态包括大卖场、综合超市和标准超市,公司定位为超市+精品百货,拥有“世纪联华”,“联华”等超市品牌。
727 3
函数计算助力世纪联华平滑支撑双11大促
|
人工智能 搜索推荐
解决方案应用实例 |搭载“业务+数据”双中台,贝泰妮实现高速奔跑
贝泰妮联合阿里云,通过建立技术中台和数据中台、升级现有的信息管理系统和会员管理系统、引入新的管理模块,进一步加强内部管理能力和产业链上下游的控制能力,实现产供销、人财物的全链路数据化管理,从而实现业务上的前后台高效运营和管理上的内外部掌控,实现优化资源配置,做到精准营销,进一步提升公司的市场竞争力。
355 0
解决方案应用实例 |搭载“业务+数据”双中台,贝泰妮实现高速奔跑
|
存储 弹性计算 Cloud Native
揭秘 | 连续3年支撑双11,阿里云神龙如何扛住全球流量洪峰?
2019年云栖大会,阿里云正式发布第三代自研神龙架构,全面支持ECS虚拟机、裸金属、云原生容器等,贯穿整个IaaS计算平台,并在IOPS、PPS等方面提升5倍性能,用户能在云上获得物理机100%的计算能力。本文将为大家揭秘今年双11最具挑战的搜索广告、金融级业务核心交易数据库如何迁移至第三代神龙架构,详解神龙架构如何支撑阿里巴巴最大规模云原生实践落地,以及神龙架构如何通过宕机演练大考、备战双11的背后故事。
揭秘 | 连续3年支撑双11,阿里云神龙如何扛住全球流量洪峰?
|
人工智能 Cloud Native 算法
双11技术总指挥汤兴:今年双11是技术和商业的完美共振
“ 今年的双11是全球极大内容电商场的超级爆发,消费者、技术、内容与商业生态之间每一秒都在产生激烈共振,实时性、复杂性和持续峰值的叠加令其成为全球技术顶峰。我们的使命就是让技术成为双11坚如磐石的稳态,让消费者感受到更顺滑的体验。” 汤兴说。
26423 0
双11技术总指挥汤兴:今年双11是技术和商业的完美共振
|
Cloud Native 双11 云计算
核心系统全面云原生化 阿里 2020 双11 再次跨越技术高峰
史上最大流量洪峰来袭,阿里云如何成功应对?一图带你看懂阿里 2020 双11 核心系统全面云原生化!
23810 0
核心系统全面云原生化  阿里 2020 双11 再次跨越技术高峰
|
人工智能 运维 监控
阿里云启用五大超级数据中心支撑双11 :“剁手”体验丝般顺滑
今年双11阿里云超级数据中心放大招了,启用全球最大液冷数据中心支撑双11,液冷服务器、机器人巡逻。
49840 0
阿里云启用五大超级数据中心支撑双11 :“剁手”体验丝般顺滑