阿里云叔同:以容器为代表的云原生技术,已经成为释放云价值的最短路径

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介:

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!


作者 | 丁宇(叔同) 阿里云智能容器平台负责人

云计算、大数据、人工智能等新技术正迅速的改变着我们所处的时代,其巨大的影响力已经从量变到质变,数字化转型成为企业发展的必然选择。 据IDC报告,全球前1000的大企业中,67%的企业已将数字化转型变成企业级战略,企业数字化转型也正成为许多中国企业的核心战略。随着企业上云成为业界趋势,全面使用开源技术和云产品构建软件服务的时代已经到来。如何更好地拥抱云计算、拥抱云原生、用技术加速创新,将成为企业数字化转型升级成功的关键。

如何在数字化时代实现弯道超车?云原生开辟了一条捷径

阿里云原生应用平台研究员丁宇(叔同)在2020阿里云线上峰会上也提到了“以容器为代表的云原生技术,已经成为释放云价值的最短路径,云原生助力企业全面拥抱云计算”。在他看来,很多企业在数字化转型的过程中,付出了不少的努力与时间,但因为对云原生缺乏了解和实践经验,加之没有好的技术与产品来支撑,导致走了不少弯路。

我们知道,传统的开发模式在迭代速度、频率以及运维方式都难以满足市场快速变化的需求,而云原生追求的就是最大化地利用其技术模式,充分发挥云计算的生产力,使得应用从设计、开发、交付、到管理的思维方式与最佳实践有机结合,从而让这个应用可以最快地创造价值,也就是丁宇所说的“最短路径”。以容器技术为例,容器就是在虚拟化的基础上向上封装了一层,作为云平台与客户交互的新界面之一,应用的构建、分发和交付在容器层面实现标准化,对于企业而言,可以大幅降低 IT 实施和运维成本,从而提升业务创新的效率。

叔同提到:“阿里云的核心优势之一就是阿里巴巴的核心业务运行在云上,形成最好的创新土壤,最先进的技术首先会在阿里巴巴自己的业务体系中进行尝试,得到了大规模的运用,证明其技术的普适性与价值后再开放给客户。”

从2011年迈进容器大门算起,阿里的云原生之路已经走了十年。这期间经历了十年双11的历练,例如2015年全面容器化帮助双11大促实现快速弹性扩容。由于业务的超大规模使得其复杂程度非常高,这也为容器技术带来了更大的挑战。例如在容器镜像分发过程中,一次发布分发几万个镜像,这样巨大的流量是一个不小的挑战。为实现效率的极致要求,阿里云利用P2P技术,实现大规模大批量的快速分发,实现10秒内完成跨机房镜像下载容器启动。 容器技术对于双11的显著影响还包括在具体的混部技术实施中,通过混部技术,阿里巴巴集团范围内能够节省30%左右的IT成本支出,在双11这个特殊时间段里,将每万笔交易成本下降超过75%。

Gartner今年4月发布2020年容器公有云竞争格局报告,阿里云再度成为国内唯一入选厂商。报告显示,阿里云容器服务在中国市场表现强劲,产品形态丰富,在如Serverless容器、服务网格、安全沙箱容器、混合云和边缘等领域,具备良好的技术发展策略。而在今年3月,Gartner第二次公开《竞争格局:公共云容器服务》年度调研报告,报告针对Serverless、Kubernetes、服务网格、容器镜像等十项功能维度进行对比,阿里云和AWS覆盖九项产品能力,产品丰富度领先Google、微软、IBM和Oracle四家厂商。

云原生裸金属,挑战性能极致,全新升级最短路径

过去几年,容器服务被各行业企业广泛接受,而阿里云凭借业界最丰富的容器产品家族和容器服务,已经连续数年以超400%的规模高速增长。在2020阿里云线上峰会上,阿里云智能基础产品事业部高级研究员蒋江伟重磅发布了云原生裸金属方案。

新一代容器服务 ACK,可以将最新神龙弹性裸金属实例的强大性能发挥得淋漓尽致,具备极致性能、高效调度、全面安全的特点:

  • 新一代神龙架构具备业界第一的 I/O 转发能力,提供最高 100G 网络带宽;阿里云高速 Terway 容器网络通过网卡直通和数据平面加速,延迟下降 30%。
  • 第 7 代实例最大支持 192 个 vCPU。ACK 智能 CPU 调度可以轻松释放强大算力,无需应用调整可以实现 QPS 20~30% 提升;结合 ENI 网卡密度提升,可以缩减 50% 的计算成本。
  • 弹性裸金属实例支持阿里云安全容器,提升端到端安全隔离能力,与开源方案相比性能提升 30%,也支持阿里云首发机密计算容器,基于软硬一体技术有效保护数据隐私。

3

在阿里巴巴内部,容器+神龙裸金属方案以超高性能支撑钉钉抗住有史以来最大的流量洪峰。以前,钉钉100% 部署在普通物理机上,疫情突发之后,政府、企业和学校对在线协作的需求猛增。通过云上神龙裸金属+容器弹性部署方案,快速地实现了钉钉业务应用 10 万核扩容需求。

在外部,尤其是在这次疫情影响下,很多企业面临快速扩容的压力,如在线教育行业,短时间内爆发式的需求,对于任何一家在线教育企业既是机遇,更是挑战。据百家云CEO李钢江透露,疫情期间百家云的业务量在短时间内增长了数十倍,要满足如此迅速的扩容需要,还要在客户无感知的情况下完成扩容,其难度不亚于交付一个新系统。

幸运的是,在这场流量战役之前,百家云已经在阿里云团队的帮助下,优化了自身容器集群架构与规划,通过阿里云容器服务ACK、基于神龙架构的弹性裸金属实例的核心方案,足以从容应对流量洪峰。相比之下,一些没有使用容器的在线教育企业,面对突增的用户量和流量,只能成倍的堆积机器,导致部署时间拉长,业务成本急剧上涨,用户体验也不佳。

为什么要采用神龙裸金属+容器弹性部署方案?因为百家云的需求是三天扩容数十倍,并且百家云的K8s集群对性能要求极高,而“容器+弹性裸金属”的解决方案非常契合这种大流量、高并发的场景。首先,阿里云弹性裸金属服务器规格较高,可以帮助百家云显著提升单个节点的容量。

其次,基于容器化构建方式,可以满足业务快速发放和弹性的要求。神龙服务器完全消除了虚拟化损耗,提升了8%的计算性能,其类物理机特性,可进行二次虚拟化。神龙的性能,加上容器的弹性,形成了天作之合。数据显示,容器运行在云上神龙反而比非云物理机的性能要好10%-15%。主要是因为虚拟化开销已经offload到MOC卡上,神龙的CPU/Mem是无虚拟化开销的,而上云后运行在神龙上的每个容器都独享ENI弹性网卡,能提升13%的网络吞吐量。

第三,神龙服务器的存储带宽和计算带宽分离,能满足百家云业务场景的大量读写需求。使用神龙服务器之后,计算能力大增。并且,百家云通过使用阿里云的高性能NAS服务,并通过水平扩展为4个集群,解决了I/O的瓶颈。

基于以上方案,借助自身的大规模集群管理能力,在短短几天之内,阿里云团队帮助百家云团队有效升级了原有的架构方案,实现了数十倍的扩容,大幅提升了其性能与稳定性,并拥有了应对爆发性规模的能力,用户毫无察觉。

丰富的云原生产品和解决方案背后,阿里云用四个最来践行最短路径

阿里云在云原生领域的投入广泛而深入,在容器、服务网格和Serverless均有丰富的产品服务,目前阿里云已经拥有国内最丰富的云原生产品家族、最全面的云原生开源贡献、最大规模的云原生应用实践、最大的云原生客户群体。其产品体系覆盖八大类别20余款产品,涵盖底层基础设施、数据智能、分布式应用等,可以满足不同行业场景的需求。

2

阿里云是国内在云原生领域的开源贡献最全面的科技公司,涵盖编排调度、作业管理、无服务器框架等,主导维护etcd、containerd、dragonfly等多个CNCF明星项目的发展,已有超过10个项目进入CNCF landscape。去年1月,阿里云资深技术专家李响成为首个入选全球顶级开源社区CNCF技术监督委员会的中国工程师,致力于推动云原生技术的落地。今年5月,阿里巴巴开源首个边缘计算云原生项目OpenYurt,推动社区在云原生和边缘计算交叉领域的协同发展。

近日,云计算开源产业联盟在OSCAR开源先锋日云原生专场活动上公布了“云原生应用十大优秀案例”评选结果,由阿里云提供技术服务的申通通用云原生计算平台和中国民生银行的场景化数据服务中台双双入选,这次评选的四大标准是:面向传统行业数字化转型,规模化应用云原生技术,提升企业资源利用率及研发效率,助力企业业务创新发展。申通和民生银行两大案例因为在云原生和数据服务中台的技术实践中表现出色,最终脱颖而出。

以申通为例,原有IDC系统帮助申通早期业务快速发展,但也暴露了不少问题,传统IOE架构,各系统架构的不规范,稳定性,研发效率等都限制了业务发展需求。在跟阿里云多次技术交流之后最终确定阿里云为唯一合作伙伴,为申通提供稳定的计算,数据处理平台。

申通原架构是基于VMware+Oracle数据库的架构,通过上阿里云,全面转型基于Kubernetes的云原生架构体系。主要有两点:

应用容器化。跟虚拟机比起来,容器能同时提供效率和速度的提升,让其更适合微服务场景。通过应用容器化解决了环境不一致的问题,保证应用在开发、测试、生产环境的一致性。

微服务改造。原先很多业务是基于Oracle的存储过程及触发器完成的,系统之间的服务依赖也是通过数据库OGG同步完成。存在的问题是系统非常难维护,也非常不稳定。通过引入Kubernetes的服务发现来做微服务方案,按业务域进行拆分,让整个系统更易于维护。

目前申通核心业务系统已经在云上完成流量承接,每天处理订单量在千万级别,处理物流轨迹在亿级别,每天产生的数据量在1T,使用1300+个计算节点来实时处理业务。正如申通上云总负责人提到的,“申通通过阿里云进行全面转型,基于Kubernetes的云原生架构体系,在成本、稳定性、效率、赋能业务四个维度获得显著成效,这些云原生技术带来的价值,是申通转为使用公有云作为主要计算资源的核心驱动力。”

4

在容器技术上,阿里云的目标是构筑新基石、新算力、新生态。帮助企业更好地支撑混合云、云边一体的分布式架构和全球化的应用交付。据 Gartner 分析,未来 80% 以上的企业都会采用混合云的架构,打造混合云和云边一体的方案也是阿里云一直在关注的方向。未来云的架构是动态、混合的架构——云边端一体,公共云能力向边缘设备端拓展,需将计算能力、AI推进到边缘,容器提供一致化的方式对云边端进行统一的应用部署和交付。基于云原生软硬一体化的创新技术,通过阿里云提供的强大算力来加速企业的智能化升级:容器服务结合神龙架构发挥性能和弹性,支持含光800芯片的调度、共享,极致优化深度学习场景的效率、成本。

容器、Kubernetes、云原生正在成为云时代的技术新标准,重塑整个软件生命周期,阿里云通过云原生正在帮助企业客户和开发者最大化利用云的能力,最大化发挥云的价值。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-06-17
本文作者:阿里巴巴云原生
本文来自:“掘金”,了解相关信息可以关注“掘金”

相关实践学习
巧用云服务器ECS制作节日贺卡
本场景带您体验如何在一台CentOS 7操作系统的ECS实例上,通过搭建web服务器,上传源码到web容器,制作节日贺卡网页。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
17天前
|
运维 Kubernetes Java
阿里云容器计算服务ACS ,更普惠易用、更柔性、更弹性的容器算力
ACS是阿里云容器服务团队推出的一款面向Serverless场景的子产品,基于K8s界面提供符合容器规范的CPU及GPU算力资源。ACS采用Serverless形态,用户无需关注底层节点及集群运维,按需申请使用,秒级按量付费。该服务旨在打造更普惠易用、更柔性、更弹性的新一代容器算力,简化企业上云门槛,加速业务创新。ACS支持多种业务场景,提供通用型、性能型及BestEffort算力质量,帮助客户更从容应对流量变化,降低综合成本。
|
5天前
|
存储 Kubernetes 开发者
容器化时代的领航者:Docker 和 Kubernetes 云原生时代的黄金搭档
Docker 是一种开源的应用容器引擎,允许开发者将应用程序及其依赖打包成可移植的镜像,并在任何支持 Docker 的平台上运行。其核心概念包括镜像、容器和仓库。镜像是只读的文件系统,容器是镜像的运行实例,仓库用于存储和分发镜像。Kubernetes(k8s)则是容器集群管理系统,提供自动化部署、扩展和维护等功能,支持服务发现、负载均衡、自动伸缩等特性。两者结合使用,可以实现高效的容器化应用管理和运维。Docker 主要用于单主机上的容器管理,而 Kubernetes 则专注于跨多主机的容器编排与调度。尽管 k8s 逐渐减少了对 Docker 作为容器运行时的支持,但 Doc
45 5
容器化时代的领航者:Docker 和 Kubernetes 云原生时代的黄金搭档
|
2天前
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
17天前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
17天前
|
供应链 安全 Cloud Native
阿里云容器服务助力企业构建云原生软件供应链安全
本文基于2024云栖大会演讲,探讨了软件供应链攻击的快速增长趋势及对企业安全的挑战。文中介绍了如何利用阿里云容器服务ACK、ACR和ASM构建云原生软件供应链安全,涵盖容器镜像的可信生产、管理和分发,以及服务网格ASM实现应用无感的零信任安全,确保企业在软件开发和部署过程中的安全性。
|
11天前
|
Cloud Native
邀您参加云原生高可用技术沙龙丨云上高可用体系构建:从理论到实践
云原生高可用技术专场,邀您从理论到实践一起交流,探索云上高可用体系构建!
|
17天前
|
人工智能 Kubernetes Cloud Native
阿里云容器服务,智算时代云原生操作系统
2024云栖大会,阿里巴巴研究员易立分享了阿里云容器服务的最新进展。容器技术已成为云原生操作系统的基石,支持多样化的应用场景,如自动驾驶、AI训练等。阿里云容器服务覆盖公共云、边缘云、IDC,提供统一的基础设施,助力客户实现数字化转型和技术创新。今年,阿里云在弹性计算、网络优化、存储解决方案等方面进行了多项重要升级,进一步提升了性能和可靠性。
|
17天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
17天前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
19天前
|
运维 Cloud Native 应用服务中间件
阿里云微服务引擎 MSE 及 云原生 API 网关 2024 年 11 月产品动态
阿里云微服务引擎 MSE 面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持 Nacos/ZooKeeper/Eureka )、云原生网关(原生支持Higress/Nginx/Envoy,遵循Ingress标准)、微服务治理(原生支持 Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。API 网关 (API Gateway),提供 APl 托管服务,覆盖设计、开发、测试、发布、售卖、运维监测、安全管控、下线等 API 生命周期阶段。帮助您快速构建以 API 为核心的系统架构.满足新技术引入、系统集成、业务中台等诸多场景需要