3 月 29 日,在阿里云计算峰会上,阿里云弹性计算负责人张献涛博士,作为开场嘉宾,做了《高效稳定,助力云上企业敏捷创新》的主题分享,回顾阿里云算力的十年更迭史,讲解阿里云强劲、稳定、安全的计算产品家族。
以下为演讲全文整理:
2020,与客户一起打破不可能
2020年是不平凡的一年,一场疫情突如而至,我们的生活方式、工作方式,甚至是我们沟通的方式都发生了很大变化。同时,很多新名词开始出现,比如云办公、云科研、云教育,很多学校也把毕业典礼搬到云上,背后都是云计算的作用。
2020年,作为一家云计算公司,我们如何与客户一起实现云转型?
疫情发生之初,科研人员需要用大量算力进行新冠疫苗与药物研发。于是,我们第一时间宣布免费开放算力提供给科研机构。在短暂的20多天里,我们对接了国内20多家科研机构,提供免费算力。
第二个例子我相信很多朋友也深度参与其中。疫情让居家办公成为常态,小朋友也通过钉钉云课堂进行在线的学习,过亿人在线办公,钉钉业务量激增,却从来不崩。
钉钉之所以在这么强大的业务压力下,还能稳定服务,一方面是钉钉过去的五年的积累;另一方面,阿里云也迅速扩容了上百倍的云资源,确保钉钉每一项服务的稳定畅行。
同时,我们也支撑了不少在线教育行业的企业,比如猿辅导,他们同样在疫情期间通过多个用户量级上亿的平台为全国中小学生提供学习支持。这背后是大量的算力支撑,其实都是云计算提供的。
第三个例子,我相信很多企业也深有体感。疫情带来的不确定性,让企业对降本增效更为迫切。上云便是降本增效的好途径,申通快递就是典型例子。去年,申通快递的核心业务全面搬迁上云, IT 投入降低 30%。
这背后的一切,都是云计算在起作用。
十年进化,铸造三大核心技术
过去十年,阿里云在产品技术经历了多次突破和创新,有了深厚技术积淀,才能在特殊时期帮助客户做好云转型。
2009 年,大家还在讨论云计算时,阿里云就成立了;2010 年我们发布了第一个产品——弹性计算;2013 年,飞天 5K 随着阿里巴巴集团最后一台小型机下线;从前 12306 买票经常遇到各种卡顿,但是上云之后,整个购票体验提升了许多。
经过几年的技术积累,我们发布了神龙架构;2018 年又发布了 ESSD 产品,存储性能在全球达到第一;2020 年我们又实现了全面云原生化。申通快递也是使用了阿里巴巴双 11 同款的上云方案。
经过 10 多年的发展,我们打造了一套飞天云操作系统。计算方面,我们有自研的神龙架构,管理百万物理服务器、千万级 vCPU。洛神云网络基础设施,让业务就近上云。存储方面,自研了盘古存储系统,储存了数十 EB 级别的数据,每年有上万亿次的数据和 API 调用。
通过计算、存储、网络三者的结合,阿里云计算家族做到了业界领先地位,迄今服务了全球超过200多个国家和地区的几百万用户。
强劲、稳定、安全的计算家族
在神龙、盘古、洛神,三大核心技术的加持下,我们的产品做到了强劲(高性能)、稳定、安全。
目前,我们正在研发第四代神龙云服务器,现在使用的是第三代。第三代神龙云服务器在存储、计算、网络方面均拥有极致性能。
我们通过自研软硬一体化的架构,大大提升了效率。神龙云服务器也是云原生最佳载体,使用神龙服务器运行容器的性能相比在物理机上运行提升 20-30%,也就是成本可以下降 30%。今天,神龙已经支持阿里云全系产品。
AI 这几年也很火,AI 所需要的加速器都比较贵,我们怎么能够为客户降低成本?
我们自研了神龙 AI 加速器 AIACC,在使用同样的硬件、同样软件的情况下,AIACC 能让 AI 训练与推理性能有大幅度提升。
存储 ESSD 是基于云上的分布式系统构建的云盘,它的所有数据都是 3 份实时落盘,吞吐可以做到单盘 4 GB/秒。
大家在上云的时候,使用更快的计算,更快的存储服务,可以让我们更好地在云上做业务敏捷创新的同时,又可以降低成本。
在网络方面,自研的飞天洛神云平台,能够让用户在云上做到网络的绝对隔离,同时实现超大规模、超强性能和弹性可扩展的特性。
除了性能之外,客户业务上云的时候,更关注的是稳定。
过去的十年间,我们从开始自研服务器和自研加速器开始,所有软件层全部自研。
通过自研,我们可以做到方便、灵活的开发。数据方面做到端到端的校验,故障预测准确率达到99%,热迁移技术让客户的业务在底层硬件故障之前就迁移到另外一个稳定的硬件上,确保业务不断。这些自研技术,让阿里云计算家族为客户提供全球领先的稳定性。
基于领先的性能和稳定性,我们的产品依然在不断迭代。最近我们的第七代ECS实例开启了邀测,这代实例整体算力有40%以上的提升,全系搭载了安全芯片,在数据安全方面可以做到上云无忧。
阿里云云盒正式开启公测
公有云虽好,但是公有云都是在各大数据中心里面,很多客户的业务会有一些本地部署的需求,我们研发了阿里云云盒。云盒可以把公有云延伸到客户的身边,就近解决对计算的需求。
阿里云云盒比较适合的场景,包括本地的数据处理,因为带宽或者成本、数据量等原因,不方便传到公有云上,公有云可以延伸到你的身边,解决掉本地的数据处理问题。
我们经常提边缘计算,需要就近去选择接入点,云盒可以延伸到边缘,也是边缘云的一种非常好的解决方案。
数据就在你的身边,大家不用担心数据上云之后会有安全或者是隐私问题。
除了刚刚讲的业务系统上云,疫情发生之后,我们看到越来越多的企业,把自己的办公系统也迁移到云端。这就很适合使用去年我们在云计算大会上发布的无影。
很多企业在意的是自己的无形资产,如代码、核心算法等,而不是像电脑或者是一般的有形资产。通过安全云桌面的形式,可以做到所有的代码都不用落地。
阿里云计算:数字创新的原动力
为了能服务好客户,我们已经构建了能够覆盖全场景的阿里云计算家族。
在云的形态上,我们有公共云和混合云;云上构建了多云化的解决方案,有针对大数据的、也有针对AI的,能够让行业客户上云无忧。
同时,我们与生态伙伴合作,让客户可以一站式将把所有的业务迁移到云端,帮助政府、零售、金融、交通类的客户,将核心业务平滑上云。
最后,我们希望通过十多年打造的强劲、稳定、安全的云计算能力,再加上企业级的服务能力,让我们客户云上业务做到稳定永续、敏捷创新、智能弹性、简单触达全球。