阿里云重磅发布云原生裸金属方案:裸金属+容器,解锁云计算的新方式

简介: 在 6 月 9 日 2020 阿里云线上峰会上,阿里云智能基础产品事业部高级研究员蒋江伟重磅发布了云原生裸金属方案。

image.png

在 6 月 9 日 2020 阿里云线上峰会上,阿里云智能基础产品事业部高级研究员蒋江伟重磅发布了云原生裸金属方案。

新一代容器服务 ACK,可以将最新神龙弹性裸金属实例的强大性能发挥得淋漓尽致,具备极致性能、高效调度、全面安全的特点:

  • 新一代神龙架构具备业界第一的 I/O 转发能力,提供最高 100G 网络带宽;阿里云高速 Terway 容器网络通过网卡直通和数据平面加速,延迟下降 30%
  • 第 7 代实例最大支持 192 个 vCPU。ACK 智能 CPU 调度可以轻松释放强大算力,无需应用调整可以实现 QPS 20~30% 提升;结合 ENI 网卡密度提升,可以缩减 50% 的计算成本
  • 弹性裸金属实例支持阿里云安全容器,提升端到端安全隔离能力,与开源方案相比性能提升 30%,也支持阿里云首发机密计算容器,基于软硬一体技术有效保护数据隐私。

image.png

在阿里巴巴内部,神龙架构已大规模应用于淘宝、天猫、菜鸟等业务,解决了高峰值下的业务性能和稳定性问题。在外部,尤其是在这次疫情影响下,很多企业面临快速扩容的压力,如在线教育行业,通过阿里云容器+神龙方案,企业可以从容应对流量突增的难题。

image.png

视源股份(CVTE)的希沃系列教育平稳应对疫情期间指数级增长的课堂流量,视源电子运维负责人许坤丰称,“疫情之下,希沃课堂作为教育信息化应用和服务工具提供商,免费向全国师生开放希沃云课堂在线直播方案。不久前,全国超过 30 万教师使用希沃云课堂开课,共开设超过 200 万节课程。面对指数级增长的流量,我们在阿里云容器服务 ACK 上使用神龙服务器和 ECI,顺利完成扩容,让系统得以正常运行。ECI 的简单易用,海量节点的特性加上神龙服务器高性能,零抖动的特点,极大缓解了扩容的压力,让我们把更多精力放在产品本身,给全国老师和学生提供更好的服务。”

云计算开源产业联盟上周公布了“云原生应用十大优秀案例”评选结果,阿里云支持的申通通用云原生计算平台顺利入选。申通基于云原生裸金属方案完成迁云,实现了围绕快递包裹生命周期的高效管理,平稳度过 双11 业务高峰。

云计算开源产业联盟对申通通用云原生计算平台评价称“该平台解决了传统应用升级缓慢、架构臃肿、不能快速迭代等问题,通过云原生架构体系,在成本、稳定性、效率、赋能业务等四个维度获得显著成效。目前核心业务系统已经在云上完成流量承接,每天处理订单量在千万级别,处理物流轨迹在亿级别,每天产生的数据量在 1T,使用 1300+ 个计算节点来实时处理业务。”

image.png

神龙架构是容器的最佳载体

2017 年 10 月,阿里云在全球率先推出了同时融合物理机和虚拟机特性的“跨界”云服务器——弹性裸金属服务器神龙 X-Dragon,它采用了自主研发的虚拟化 2.0 技术,兼具“虚拟机的心脏”和“物理机的肌肉”,被认为是云计算领域的新物种。从 2017 年发布第一代神龙架构开始,历经了软件虚拟化、通用硬件虚拟化、专用硬件芯片虚拟化三个阶段后,第三代神龙架构实现了裸金属服务器、ECS 虚拟机,弹性容器实例 ECI 等多种计算平台的架构统一和全面优化。

蒋江伟在演讲中也提到,客户普遍有个共识,那就是容器与物理服务器的结合是最佳搭档。但是普通物理服务器天然具有一些缺陷,比如运维复杂度高,缺乏弹性。而以神龙架构为基础的裸金属服务器,搭配容器服务 ACK,不仅提供非常好的性能,同时具备虚拟机的运维灵活性,正好弥补了物理服务器的弹性缺陷,对于构建容器环境而言,裸金属是更好的选择。

据蒋江伟介绍,云原生裸金属具备极致的弹性、高效的调度能力和更全面的安全能力。在普通的应用场景下,基于神龙架构的容器服务ACK与自建容器相比,可以实现QPS提升30%,计算成本下降50%,容器安全性能提升30%。

对于线下传统物理机服务器,企业客户最大的痛点就是缺乏弹性,运维复杂,无法应对快速发展的业务需求。神龙裸金属服务器,具备虚拟机的体验,物理机的性能。扩容交付周期几周缩短到分钟,与虚拟机相比性能“零损耗”、“零抖动”,与传统物理机相比性价比提升 20% ,是用户上云的最佳选择。

钉钉以前 100% 部署在普通物理机上,疫情突发之后,政府、企业和学校对在线协作的需求猛增。通过云上神龙裸金属+容器弹性部署方案,快速地实现了钉钉业务应用 10 万核扩容需求;借助神龙+容器的超高性能支撑钉钉扛住了有史以来最大的流量洪峰。

此外,社区版本 K8s 容器调度技术存在一定局限,无法充分使用神龙裸金属服务器强大的算力。应用在多 CPU 核心场景下,可能会引起资源争抢、CPU 频繁切换等情况。通过开启容器服务 ACK 的智能 CPU 调度,可以提升缓存的命中率、减少 CPU 中断和切换次数,有效提升性能,在不增加硬件资源的情况下性能提升 20%,QPS 从 25 万提升到 30 万。

image.png

容器服务 ACK 不但支持对 CPU 的高效调度,还新增了对业界最强算力 AI 芯片 - 含光 800 的多核调度支持,可以成倍提升 AI 业务资源利用率和性价比。阿里自研的含光 800 芯片具备强大的应用算力,在淘宝的拍立淘场景中,对商品库每天新增 10 亿商品图片,使用传统 GPU 算力识别需要 1 小时,使用含光 800 后可缩减至 5 分钟。对于强大的含光 NPU 芯片,阿里云容器服务 ACK 独创了面向容器的虚拟化和共享能力,充分发挥含光 800 多核资源,把多种业务精确调度到同一含光 800 芯片,充分利用计算资源,显著降低计算成本!

image.png

传统企业,尤其是一些大型企业,对从私有数据中心迁移到公有云上并不放心。其中数据安全问题是首要关切,需要独享使用物理机才会有安全感。云原生裸金属方案,结合阿里云安全沙箱容器技术,提供从基础设施到应用运行时端到端安全,非常适合对隐私和隔离要求较高的应用场景,而且与开源方案相比性能提升 30%。

阿里云此次首发机密计算容器,基于软硬一体技术实现全链路加密,有效解决数据泄露、非法数据访问等问题,可以应用在区块链、金融交易、基因计算等业务场景中。

云计算的下一站,是云原生

神龙是面向云原生设计的新一代云基础设施架构,同时支持裸金属服务器、ECS 虚拟机,ECI 弹性容器实例等多种计算形态。神龙架构采用软硬一体设计,可以将网络和存储的转发任务卸载到神龙芯片上,避免了底层资源争抢而导致的 ECS 虚拟机性能波动。第三代神龙架构还引入硬件级别 QoS 能力,为客户关键业务带来更强的保障。基于神龙架构的 ECI 弹性容器实例,性能优于虚拟机中运行的相同规格 Docker 容器;具备极致的弹性能力,可以在一分钟内扩容 1000 业务容器实例。

客户可以在一个 ACK K8s 集群中划分不同节点池统一管理弹性裸金属实例,ECS 虚拟机实例和弹性容器实例。根据应用负载特性,可以充分优化计算效率、提升资源利用率、降低计算成本。对于需要极致性能和强安全隔离场景,用户可以采用裸金属实例;对于存在明显业务峰谷的场景,虚拟机实例可以提供更灵活的弹性。而弹性容器实例可以更好应对突发业务流量,提供免运维的用户体验。

容器服务 ACK 已经成为企业云原生操作系统,与 EDAS 微服务架构,ARMS 端到端可观测能力全面集成,全面提升 IT 敏捷性,为企业数字化转型提速。

本文转自<阿里巴巴云原生技术圈>——阿里巴巴云原生小助手

相关实践学习
使用ACS算力快速搭建生成式会话应用
阿里云容器计算服务 ACS(Container Compute Service)以Kubernetes为使用界面,采用Serverless形态提供弹性的算力资源,使您轻松高效运行容器应用。本文将指导您如何通过ACS控制台及ACS集群证书在ACS集群中快速部署并公开一个容器化生成式AI会话应用,并监控应用的运行情况。
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。 &nbsp; &nbsp; 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
11月前
|
存储 人工智能 并行计算
2025年阿里云弹性裸金属服务器架构解析与资源配置方案
🚀 核心特性与技术创新:提供100%物理机性能输出,支持NVIDIA A100/V100 GPU直通,无虚拟化层损耗。网络与存储优化,400万PPS吞吐量,ESSD云盘IOPS达100万,RDMA延迟<5μs。全球部署覆盖华北、华东、华南及海外节点,支持跨地域负载均衡。典型应用场景包括AI训练、科学计算等,支持分布式训练和并行计算框架。弹性裸金属服务器+OSS存储+高速网络综合部署,满足高性能计算需求。
|
6月前
|
网络协议 Linux C++
Window 部署 coze-stdio(coze 开发平台)
本指南介绍了如何在本地环境部署 Coze Studio,包括环境配置、镜像源设置、模型配置及服务启动步骤。内容涵盖 Docker 配置、模型添加方法及常见问题解决方案,适用于 Windows 11 系统,需最低 2 核 CPU 和 4GB 内存。
2162 8
Window 部署 coze-stdio(coze 开发平台)
|
6月前
|
存储 SQL 前端开发
跟老卫学HarmonyOS开发:ArkTS关系型数据库开发
本节以“账本”为例,使用关系型数据库接口实现账单的增、删、改、查操作。通过创建ArkTSRdb应用,演示如何操作RdbStore进行数据管理,并结合界面按钮实现交互功能。
314 0
跟老卫学HarmonyOS开发:ArkTS关系型数据库开发
|
11月前
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
1849 8
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
开发框架 安全 开发者
Docker 是一种容器化技术,支持开发者将应用及其依赖打包成容器,在不同平台运行而无需修改。
Docker 是一种容器化技术,支持开发者将应用及其依赖打包成容器,在不同平台运行而无需修改。本文探讨了 Docker 在多平台应用构建与部署中的作用,包括环境一致性、依赖管理、快速构建等优势,以及部署流程和注意事项,展示了 Docker 如何简化开发与部署过程,提高效率和可移植性。
326 4
|
机器学习/深度学习 人工智能 并行计算
【AI系统】芯片的编程体系
本文探讨了SIMD与SIMT的区别及联系,分析了SIMT与CUDA编程的关系,深入讨论了GPU在SIMT编程的本质及其与DSA架构的关系。文章还概述了AI芯片的并行分类与并行处理硬件架构,强调了理解AI芯片编程体系的重要性,旨在帮助开发者更高效地利用AI芯片算力,促进生态繁荣。
369 0
|
Java 数据安全/隐私保护
Java 包(package)的使用详解
Java中的包(`package`)用于组织类和接口,避免类名冲突并控制访问权限,提升代码的可维护性和可重用性。通过`package`关键字定义包,创建相应目录结构即可实现。包可通过`import`语句导入,支持导入具体类或整个包。Java提供多种访问权限修饰符(`public`、`protected`、`default`、`private`),以及丰富的标准库包(如`java.lang`、`java.util`等)。合理的包命名和使用对大型项目的开发至关重要。
1079 2
|
C语言 C++ Windows
QT多插件通信框架CTK编译记录
本文记录了编译QT多插件通信框架CTK的过程,包括编译结果截图、部署配置、Log4Qt编译配置、参考链接和拓展资料。文中提供了详细的编译步骤和配置文件示例,以及相关的资源链接。
678 0
QT多插件通信框架CTK编译记录
|
存储 分布式计算 Kubernetes
JuiceFS-开源分布式文件系统入门(一篇就够了)
讲解JuiceFS的一些概念、架构以及实操的案例
8361 0
JuiceFS-开源分布式文件系统入门(一篇就够了)
|
Java
深入理解 Java 8 函数式接口:定义、用法与示例详解
深入理解 Java 8 函数式接口:定义、用法与示例详解
863 2