《阿里云 ACK One、ACK 云原生 AI 套件新发布》 | 学习笔记

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 快速学习《阿里云 ACK One、ACK 云原生 AI 套件新发布》

开发者学堂课程【阿里云 ACK One、ACK 云原生 AI 套件新发布《阿里云 ACK One、ACK 云原生 AI 套件新发布》学习笔记,与课程紧密连接,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/1072/detail/15401


《阿里云 ACK One、ACK 云原生 AI 套件新发布》

 

内容介绍:

一、分布式云容器平台 ACK One

二、Ack 云原生 AI 套件

三、容器技术的价值

四、容器使用程度和应用阶段

五、 ACK one 背景背后的原因

六、相关时机分析

七、产品适用分析

八、体现 ACK ONE 能力的词与具体案例

九、Ai 和云原生 AI 的区别

十、ACK 到 ACK ANYWHERE带来最大的价值

十一、心目中对于容器以及它未来的整个的想象空间

在云平台多场景下,今天正式开放分布式云容器平台, ACK One 进行公测,无论的集群是构建在公共云,专有云,自由 IDC 还是边缘节点,都可以通过 ACK One 实现容器的统一管理,并且简化集群管理界面。企业轻松应对多集群的一个形态,今天也带来一个新的产品: ACK  云云原生 AI 套件,它可以提高容器在运行 ai 任务时的计算,资源利用率,加速任务执行的速度,使仿真效率提升60%。加快 ai 数据访问速度35%,提升分布式训练效率20%。image.png

在这次峰会上技术产品事业部的负责人发布两个云原生容器的产品和能力。他们分别是阿里云分布式云容器平台 ACK One   ACK  云原生AI套件,我也会分别两部分稍作展开介绍一下这两款产品。首先看一下企业的 IT 架构演进及数智化升级背后的一个新趋势,从 IT 架构演进来看。有报告曾预测到2025年50%的大型企业,将来他们选择的地域通过分布式的服务。来实现业务模式的一个转型,还有 idc 的报告,则显示2021年已经有86%的企业采用多云混合云的架构,而且到2023年50%的新基础设施也是部署在边缘段。image.png

从这些调研统计可以看到。在未来的几年保有一定量数据 idc 数据中心的传统企业客户更倾向于构建混合云的形态。有效的将资源利用同时也可以实现业务的一个逐渐上云,这期间就形成一个分布式的一个形态。从数字化的升级来看,也是已经大踏步的进入到数字化数据的智能时代, ai 人工智能作为数值时代最重要的一个驱动力之一,在近10年也是有一个长足的一个发展广泛的一个应用,尤其是以深度学习为代表的一个 ai 技术和服务也是已经在计算机,视觉语音和自然语言领域,理解一些领域取得众多的一些突破。并且进入甚至是影响各行各业的创新通过对大量行业的客户需求和技术社区的发展趋势的分析。也清晰的观察到 AI 服务已经成为一个趋势,在深度学习 ai 系统正广泛采用着容器等圆形的云原生的技术来加速工程化的落地,也曾预测到。到2023年70%的 ai 应用,就将基于容器和 serverless 等技术进行一个计算模型的一个构建。

简单回顾一下在2021年阿里云容器服务就宣布全面升级为 ACK Anywhere 这里面旨在让企业在任何需要云的地方都能获得一致的容器基础设施能力。 ACK Anywhere 产品家族,也提出面向易购计算支撑资源调度网络云原生AI智能化运维与云原生质品分发等6大方向的优化升级,通过方向看出这次升级已经包涵面向企业 it 架构演进以及数字化升级路径上。阿里云的一个准确的判断和坚定的一个投入看到未来的坚定的一个投入的同时也已经进入到2022年。image.png

2022年,ACK Anywhere他们家族就在国际的权威咨询机forester发布的。全球容器能力报告中得到一个明确的一个认可,在2022 q 1一的一份报告里面显示阿里云也是首次进入全球公共容器平台领导者的一个象限,并且在容器产品能力维度上评分是最高。报告中也指出,阿里云是中国和亚太地区领先的公共云平台。其容器服务已经扩展到全球,阿里巴巴集团也已经广泛地拥抱云原生。超过90%的应用程式应用程序,已经在的集群容器服务服务上进行一个运行。阿里云也是有效的将这种经验转化为广泛的云原生服务,为客户构建数字业务的赋能。阿里云容器产品在全球领先的一个优势,对客户的需求场景也会提供全面的一个支撑,image.png

在今天云峰会上推出分布式容器平台 ACK One 从今天开始会正式进入公测。为更好的服务客户让用户清晰的解到 ACK 原生 AI 套件的能力,也将其从套件组件升级为商品化进行一个发布,进行一个商品化的一个发布。 ACK One 的产品的定位是面向分布式云,使用简化多集群管理。它的使用方式是以公共运维标准服务界面可以一键道开通。实现开箱用管理在多地域的多集群的一个系统化的一个管理。 Ack 云原生 A I套件,一个产品定位是面向 AI ML 一个工程化加速 ai 平台的一个构建。它的使用方式也是以公共云容器服务 ACK 为服务基础。在集群中可以一键得开通套件,来实现一个商品级的能力的一个使用。接下来,就分别介绍一下两款产品image.png


一、分布式云容器平台 ACK One

1、 ACK One 产品能力概览image.png

首先先看一下分布式云容器平台 ACK One ACK One 它是以公共为标准的服务界面的提供,面向分布式多级云的一个统一容器,平台是可以让任意基础设施的容器集群都拥有云产品服务级别的获得支持的一个产品,不管是的集群构建在中心云本地云,边缘云,云盒专有云等都可以由 ACK One 进行一个公共云视角的一个统一的多集群管理。 ACK One 它是具备着一个简化混合云弹性简化地域应用管理以及提供标准的云服务能力下沉的一个能力。同时它也构建包含数据备份和恢复,包括帮助企业实现一个集群的快速迁移,是线上的一个低成本融资的一些能力。可以帮助去实现统一的集群管理。统一的资源调度统一的应用交付统一的一个备份和容灾。这是它的能力的一个概 

2、 ACK One 支持的云产品和云服务image.png

ACK One 是以公共作为标准的服务界面,他也会是广泛地应用到云上的一些产品和服务的。通过 ACK One 可以让阿里云的公共云产品实现服务的一个 ANYWHERE 可以验证到 idc 国内乃至海外的一些其他等等。通过打通云上 LAAS 资源,可以提供云上的 ECS , CPU 的节点池。,让线下的 idc 机房也能获得上的优势的这些资源的一个弹性能力。通过各种组件下沉提供可观测的服务。包括服务治理及流量调度和产品的支持。也会提供 philips 云上的集群成本优化的解决方案。把企业更好的去进行一些材质的管理和预算的一些评估,也包括会提供内建的备份中心,实现低成本容灾有效的防实现防勒索。并且支持统一的一个安全的一个巡检一些管理的能力。这是他广泛地打通云上的这些产品和服务所带来的。

(1)某自动驾驶公司两地三中心架构(多集群应用分发)

某自动驾驶公司也是基于 ACK One 包括全局的流量管理GTM以及云解析dns来实现一个两地三中心的一个架构,轻松的实现分布式云多全场景下的一些流量的调度和应用分发,虽然它都是全部都用到阿里云集群,他是分发在在不同的地域,在不同的一个地域的场景下,可以提供一个在全局视图上有一些有着明显优势的一个能力,会提供一个应用的概念抽象帮助运维团队可以在一处就可以获得多集群的运行状态包括集群的一个简化。而且也不用再多本地去管理多个集群,有效地降低维护的一个成本。同时运维同学也可以通过 ACK One 差异化配置,也获取抽离提取的一个能力,有效地应对不同的应用在不同集群中的一个配置,一个差异化区分和变化,客户也借助 ACK One 的一个开箱用的工作流的能力轻松的就实现多集群的分发的一个能力。这是一个自动驾驶的一个公司典型的两地三中心架构的案例。image.png

2)Vivo 混合云场景的弹性计算(AI算力弹性)

接着再看一个案例是 vivo ,清楚它的一个企业的业务范围。Vivo也是在新的时代以后基于 ACK One 注册集群的能力实现分布使用场景下云突发应对 gpu 的一个资源弹性的一个需求。客户也是利用专线打通客户线下的 idc k8 集群,通过 ACK One 的一个注册集群能力和云上的弹性的 GPU 节点进行一个打通,实现资源的统一纳管和弹性伸缩的能力,构建一个混合云的一个解决方案,借助 CEN ACK 的注册集群的方案客户 idc 侧的 GPU,QS 集群注入云上的控容能力。可以利用云的快速交付来满足业务的一个需求,也借助着 Ack agent 的一个无侵入方案,继续使用原有集群的云上云下资源去管理云上和云下的资源。不用做任何变化,群管理应用部署的方式也都保持不变。他的工作流程也就不需要做调整,这是 VIVO 在借助 ACK One 构建的一个混合云场景的弹性计算的能力,而且是一个 ai 算力的一个弹性。这是提到的 ACK One 的两个客户案例image.png


二、Ack 云原生 AI 套件

下面看一下 Ack 云原生套件的一些介绍。在阿里提出云原生 AI 目标,也使用云原生的技术和生态。帮助用户系统化的便捷高效的去构建自己,符合企业需求的公众平台,能够实现快速迈过一些门槛。开启能力的一个投产的一个流水线。也是将云原生 ai 进行一个定义它可以是充分的利用资源的弹性,易购的算力,便捷的服务,以及容器化自动化微幅云原生的一些技术手段,为  AI   ML 提供工程效率高成本低廉,扩展可复制的一个端到端的一个解决方案。云原生 AI 的核心的能力的一个着眼点在于是底层的异构资源通过基于 kubernetes 和容器技术,实现一个统一的资源管理,屏蔽掉各种计算存储网络资源的运维调度和资源利用率优化上的一些复杂性。向上也暴露一个标准的资源使用接口和观测指标。上层的一个工作负载通过 kubernetes kubeflow 等社区一些标准的架构和 API 兼容支持一些算法和框架大数据高性能计算任务的一些类型,有统一调度和统一工作流,简化整个工程的一个复杂度,保障任务的规模和性能。image.png

1、用户需要的云原生 AI 产品

用户需要怎样的产品来帮助他们去进行深度学习工程从三个维度给一个需求的一个定义image.png

(1)效率高

第一个维度是效率高,用户是希望能够统一管理 GPU, NPU ,RDMA 等一些机构的一些资源优化资源的利用率。高效调度作业实现端到端的一个 AI的一个任务。生命周期同时支持多户的一些共享和团队的协作

(2)兼容性好

第二个是兼容性强。支持能够支持主流的以及客户自己自研的自由的一些ai的计算引擎和模型。包括能够集成各类的存储提供自动的加速数据,访问这一些能力,包括提供一个标准化的集成业务应用和大数据服务的一些能力。同时也是需要满足数据安全的一个绝对的一个要求。

(3)可扩展

第三个是可扩展。云原生技术最吸引人的特征之一是它能够标准化易扩展。同样在云原生 AI 产品需要标准的API和丰富的工具,一个前提之下可以保证架构实现一个可定制,可扩展,可组装,用户方便的去进行一个定制和集成。最后为帮助用户,把 AI 工程里的用到各种业务的环境里面。云原生 ai 它天然需要适配不同的环境,公共云专有云混合云包括边缘云一些环境。 ack 的云原生 AI 套件作为商品进行一个全球27个区域的一个同步上线。而且是一个免费公测的阶段,在未来的一个月到两个月左右会进行一个正式的一个商业化,也可以一些官方的公告,无论是 ai 技术的积累生,定制化需求高的大中型企业还是业务发展快希望借助建立 ai 快速迭代的一些创业公司,都可以根据自己的需求来使用云原生 AI 套件。快速构建自己的 ai 平台,开启云原生 ai 之路。

2、ACK 云原生 AI 套件产品架构image.png

ACK 云原生 AI 套件产品架构。整体采用一个分层组件化的一个架构,能力也是覆盖资源管理 AI 任务的一个调度和弹性包括 AI 数据的一个加速的一个工作流大数据服务集成 AI 作业管理以及提供二次开发和应用管理上一些丰富的一些能力。容器服务的运维平台的运维算法工程师以及数据科学家都提供相应的能力组建和工具,包括可视化的工具。用户可以基于云原生套件的组件,轻松地去组合符合自己使用体验,包括在企业内的安全要求的一个 AI 平台.也可以继续利用套件提供标准的 app 提供标准 api 和服务集成阿里云提供的这一些作为服务,包括开源社区的 AI 引擎和模型都可以进行一个继承。 ACK 云原生要见他的一个非常灵活和组件化一个选用的一个产品架构。

针对工程落地比较难的一些,比较困难的是云原生套件也是重点支持异构计算和深度学习任务的这两大核心场景,在针对异构计算一个场景里面,可以实现一键的去部署CPU,GPU,VGPU,NPU,RDMA 集群,实现统一运维。支持多集群的一个多维度的 GPU 监控,健康的检查和告警。也会支持多种的 GPU 调度策略,包括提供共享隔离,以及优先级的调度,以及拓扑感知。包括会提供自动挂载共享存储的一些能力,包括 NAS,CPFS,OSS 。同时也会支持多种监控指标自动的几个自动弹性伸缩计算资源。针对 AI 任务一个场景,利用云原生套件提供的工具,用户可以一分钟就可以开启深度学习的任务。端到端到端实现深度学习任务的生命周期的管理,包括模型开发训练以及支持 TensorFlow , Pytorch ,, Horovod 等开源框架和  PAI  , AIACC  问里自研优化框架,支持 Spark , Flink , Presto 等大数据服务任务级调度策略( Gang , Binpack , Capacity ,优先级队列),弹性数据集管理和分布式数据缓存加速.集成阿里云基础服务,综含性能优化这是面向异构计算和 ai 任务这两大核心场景提供的一些能力。image.png

3、云原生 AI 套件快速入门

如何使用 AI 套件在阿里云上使用上很简单,首先创建 ACK 集群去添加的技术节点其次可以按需的去在集群内开启的云原生套件,实现一键的一个安装,包括也可以使用命令行控制台或者 SDK 直接就去向集群发起 ai 模型的训练任务。最后就可以将训练好的模型在ACK 集群中发布为线上的推理服务。image.png

(1)赢彻科技与阿里云容器 ACK 团队共创云原生 AI

为加速 AI 算法研发,赢彻科技与阿里云容器 ACK 团队一同探索基于云原生 AI 技术,通过灵活定制,按需使用的容器化 jupyter notebook 开发环境,进一步优化 AI 算法开发效率在计算存储分离架构下,通过 Fluid 云原生数据编排和加速,大幅优化数据访问性,提升资源利用率。通过容器 ACK Serverless ECU 弹性和云原生数据湖方案,满足赢彻仿真实验的高并发与低延迟的大规模弹性资源供给,使得自动驾驶仿真提速20倍以上,计算资源的消耗节省约30%。这云原生 AI 套件在自动驾驶一个呈现上非常典型的一个客户的用法和它的一个案例以及一个效率的提升和资源一个节省。image.png


三、容器技术的价值

去年云大会上阿里云正式宣布容器服务全面升级为 ack any where。让企业在任何需要用到的地方,都能够获得一致的容器基础设施能力。今天上午在阿里云峰会上 ACK One 正式宣布,全面开启公测,同时推出全新升级的 ACK 云原生ai套件。这两款产品适用于哪些企业又将给企业和开发者带来什么样的价值邀请到三位技术专家一起跟聊一聊产品背后的故事。

今天在上午的分享里面,主要讲在算力时代,需要应对哪些挑战和要解决哪些问题,第一个问题容器技术在的一个算力时代下。对企业来讲他的一些独特的价值有什么

对企业来比较独特的价值更多的是它能让英文交付更加标准。让业务能够面向云的时代,去进行一些现代化的一个架构的重新设计。包括它本身也会是逐渐的成为云时代的新的一些技术标准比如平滑的迁移比较快速的去完成一个开发,能够实现一个智能的一个运维。通过比较高明的一个部署,降低成本。但是现在有不少企业是因为这种标准化交付或者更精细的这种部署,利用率来去使用云容器一个技术。和5g 时代里最厉害的肯定不是快属性一样,标准化交付什么话降成本这件事情和最基础的应用也更先进和更广泛通过容器化,它能够带来生产关系也好生产或者组织里的生产关系和生产力的一个共同的一个计划。只要话题打开就可能比较大,也它可能更多的是企业或组织能够更好地面向敏捷的曲面,像开发以及的业务单元也能够更加的一个速度去实现一个自动化的一个交付。

对于一个算力时代,容器最大的一个价值体现在如何快速的把各种易购的算力聚集在一起,用一个非常高效低成本的标准化的方式。去承接它上面的各种各样的业务应用和业务的复杂的类型,来适应它的不同而不断地变化的快速迭代的业务的需求。

一个方面知道已经进入数据智能驱动时代 ai 的时代。如何在 AI 下面的各种异构资源,包括像CPU或者各种各类的 NPU的的一个一个加气的一个大规模集群里面。用容器的方式快速帮他去加速的 ai 生产。 AI 的任务的管理调度生产效率,容器在时间里面做到一个很好地落地的场景。另外如何去帮助在的各种的算力之上,把他的业务能力输出到不同的场景和地里面去。甚至跨地域上面去,不管是在一个数据中心还是在边缘的节点上面,甚至是在一些更小的一个设备上去,是否能通过容器来达到一个标准化的一致性的一个交付运维和服务的一个体验,这也是一个非常有价值的落地价值一个场景。这些实际上在算力时代做出一些贡献和发挥非常大优势的一个地方。

讲到算力时代,今天看到很多各种各样的 CPU 的成绩包括 risc v等等各种各样的 CPU 的时代,但一般的产品里面有更大的新产品。通云原生的技术,可以无缝地把不同的应用分别部署在这些不同的这种算力的的 CPU 上,对用户来是一个非常透明的一个应用。这就给的整个的未来的地方的可能性增加非常大可能性。从过去的强调单个核的强劲的计算能力等等这种到没瓦特更好的性能追求更好的这种

性价比。今天云计算时代,它是仅仅有5%的 ip未来还有95%的可能性。对于国对民生来,存在着非常大的价值。应该这里面通过  ACK One 的技术,是可以极大地破坏影集,放在编辑可以从云上到云下到边缘。提到多种异构的另外一个点性价比提出来本身能够带给整个行业非常大的改变,能够提供一个非常高性价比的地方的能力,是容器技术的在家除现在的虚拟化技术,可以提高更高的部署密度以及更标准的标准流程,来提供更高的性价比。总的来通过延伸和容器的技术能提供更高性价比的体验。第二个能够提高更大的边界的支

 

四、容器使用程度和应用阶段

从对于客户的解和对行业云原生应用的一个情况,企业对于容器目前的一个使用程度,或者是它的应用达到一个什么样的阶段

就可以从几个维度来看,首先是总体规模上这边有几个数字,也是从对外的一个公开过数字,由多家的这种权威机构去进行一个评测,也是国际的一个评测机构,ACK 的整体能力也位居领导地位也是有很强的市场影响力,所以这边的数据也可以作为一个参考。而且全球的客户也是可以服务超过2万的一个企业客户其中公共云的每月的容器镜像它拉取次数次数已经超过20亿次,从这个角度也可以看到是整体的企业客户用容器以及包括去用镜像来去做,它的标准交付物已经非常的高频次。每个月去达到21亿次一个拉取的次数,也是一个非常可观的一个规模。再一个是一些企业类型从企业类型角度来,最开始采用容器的,拥抱容器的这一些云原生技术的,并且广泛应用的可能是一些互联网企业,他们还是非常愿意去促进或者推动整个基础的一个进化的。包括有一些企业的一些亲身体验,也是体会到云原生的一些价值,比弹性简化运维高密度部署,一些成本等等,包括阿里云的ACK 一些产品一键去打通云上的这些基础设施,大大简化很多客户的上手门槛,所以有发展的这种数字化转型的一些传统企业。或者一些得制造,金融,包括的零售一些行业的客户也是通过容器去上,能够去更好的适用云。

再一个角度负载类型。介绍的这种业务类型里面,有不少都是这种维服务形态构建的这种在线应用,包括还有一些有状态的这种应用有一些数据库,类似有状态应用,最早是,但现在也扩展到刚才的ai和大数据这种数据密集型计算的这些应用和作业,包括一些边缘端的一些,用的一些场景非常广泛的。使用方式上也会有一些变化。负载类型上可能还是更多的也是带有更多一些创新领域再延展。

方式的变化是指哪些?

使用方式从最早就比如很多业务刚刚去接触容器,去使用的,它可能有一些早期一些试点应用。去创建一个集群去进行业务,但随着它更多的体会到红利和收益,他也是渐渐延展到延展到更多的这种项目或者是更多的这种类型,也会去创造出更多的一些,甚至在不同的机遇。不同的地域,所以它的业务发展有不同地域有着相应的一个分发,包括随着 ai 技术的更广泛的普及。有大量的一些企业采用 ai 技术,大量的围绕数据密集型场景的这些使用场景都在发生,这种方式使用方式都是一些比较典型的和能看到的一些变化。


五、 ACK one 背景背后的原因

随着的对方的需求的这些增加,特别是 ai 大数据的等等的业务场景自动驾驶的场景。对范例的要求是越来越高。今天在一些企业里面,他为去布置一个 IDC 的数据中心,他可能整个的周期要几个月的采购周期安装等等。怎样懂得资源才能够到位。这时候在业务飞速发展的情况下,他需要更多的办法包括 CPU资源计算,计算资源以及存储资源这时候通过混合云的方式,通过把原 idc 和云上通过专线打通以后可以借助影像包括 CPU  gpu 。以及巨大的存储能力,帮助业务快速的发展,它的业务规模。可以看到很多的特别适合人工智能相关的一些客户。再多大量的医学训练的场景的情况下,需要再要在能够有有数百张卡的支持。做一个大规模的训练,通过的 ACK one 的注册地均的能力,以及把云和云下拉成一张网一个地区。成这种大规模的继续学习的训练的任务,所以混合云能帮助的客户实现一个无线的范围的扩展,得到一个性价比非常高的一个方式,支撑他们业务的快速增长

易购云的方式,今天来的企业,他过去的规模比较小,是集中在一个地步,比如在北京部署所以它的业务规模的扩展,它是需要让它的业务在中国的更多的机遇包括北京上海等,等区域实现一个两地三中心的这种全国的部署。就看到这里边就需要一个云定义的这种多集群的的运维和管理体系,能支撑他的业务的全国发展。更进一步有很多的出海企业,他需要让它的业务也能出海,这时候就涉及到一个国内和国际的的义务的发布管理,以及多集群的管理。ACK one 就能提供完整的多集群的管理,以及整个的运维,再加上对整个的应用的分发的一些能力来支撑的国内的这些大型的集互联网企业能够快速的去扩大他们的业务。


六、相关时机分析

关于相关时机分析,因为2017年整个的容器的形态还没定下来,但是可以看到有 AI ,所以  K8S 还处于比较初期的阶段。整个的企业的接受程度并不是很高,到今天整个国内及国际上对 k8s 以及 ack 的技术程度已经达到一个非常高的水位,这时候能看到包括云上以及云上都能够统一的 k8s 的这套规范的管理的这些集群以及地方立法。这时候在有单个地区或者是这种技术体系,已经被行业所认可的情况下,会更进一步做到一个全地域或者是再把全球的来支撑的以 k8x 为基础基座的的一些基础的一些能力,今天的  ACK ANY WHERE 可以支撑任何地域的 k8s 集群。可以把多个集群并联在一个 ACK ONE 之下,实现这种多集群多积聚的的管理能力,更多的是的应用的容灾备份以及数据的容灾备份也在这种基础之上,提出更高的需求,需要的数据的多地域的可用多地的融资能力以及对安全的一些管理,之前的基础题都在单地域单集群情况下,今天就会发两道多地域多集群情况,这是一个技术从2017年从开始到逐渐的2021年,已经是成熟的一个过程里面逐渐到更高级的实现这种全地域的进行管理和进行这种用维护的能力。

 

七、产品适用分析

每次发布一个产品的时候,业绩都会包括很多,客户也会关心到底适不适合用这款产品。或者产品适合什么样的一个企业画像。

很多客户的这些集群,它是分布在不同的地域,甚至于是不同的这种计算的一些类型,这边和  ACK ONE  产品的有些特点首先企业可能更多的是有一些自家 IDC ,如果原来这一次希望去进行一些资源利旧,也是可以通过 ACK ONE 结合一些,现在已经标准化这种符合一致性的 k8s 给接上来,形成一个多层的一个整个管控的一个形态,简化成一个去管理,另外一种可能去企业有一些这种成本敏感,或者是一些稳定性要求或者一些合规性要求在一些海外阿里没有覆盖到一些 region ,有一些其他的一些构建,也会是非常适合一些场景,去通过多集群的拉管把这种一致性只要符合一致性的任何的标准化的 k8s 进行一个拉管。可能还有一些业务,因为发展比较快,不同的业务存在这种不同的这种集群的创建时间。他的管理比较复杂的,可以把它简化成一个集群,在 one 的这一个形态下进行一个统一的大管,包括甚至于有一些线下的这些在机器里面是有若干的这种 GPU, NPU 这些卡进行希望只是在完成一定的算力的基础上,也希望有一定的弹性能力,也可以把它和云上 GPU 的一个资源进行一个打通,实现一个云上和云下资源的联合调度一个场景。包括对于阿里云的这些标准产品有一些需求,但是资源现在还是在 IDC  里面的。这些计算的算力的情况,是可以把云上标准的原产品的能力,比如日志,比如监控。包括一些安全能力都可以进行一个通过 ACK ONE 进行下沉到客户的 idc ,实现一个统一的视角去进行遏制的手机监控采集。包括安全的一个统一的一个策略管理,都是 ACK ONE 比较适合的一些客户的一些场景,或者方向。


八、体现 ACK ONE 能力的词与具体案例

如果是一个词,应该是统管。一个任意的一些 K8S 都可以统一的由 ACK ONE 进行一个标准化的管理,实现一个统一的方面。

刚才讲到云计算,计算最重要的两个方面是,一个是有不断扩大边界,第二个是金融性价比的地方能力, ACK ONE 非常满足于讲的边界,它是一个无边界的把计算能力,他可以去帮助管理任何的 k8s 集群,与任何的这种计算形态的这种计划的这种形态。这是无边界的计算。

有没有一个具体的客户案例,可以不客户具体的名字,但比如他是哪个行业的,它用的产品,都给客户带来最大的价值。考虑到客户这边的一个授权因素,大概其他行业现在有一个比较典型的客户,是用这种两地三中心的一个架构来构建它的再多集一个活的一个架构,比较火的自动驾驶领域的一个客户。所以应该是比较喜欢一个的一种 ACK ONE 。

因为客户可能还是非常倾向于通过 K8S 来去构建它的度的个架构借助 ACK ONE 里面的东西分发,包括帮他简化成一个,去整个的一个弹性这些都可以进行简化,所以它也是非常喜欢一种形态

在没有这款产品之前,他遇到的最大的问题,或者他迫切需要产品的一个最核心的原因是什么

对于客户来,他最核心原因是多集群的形态下的应的一个配置可能是有不同的,这边也是支持这种不同的这种机型上进行一些配置一个下发,客户管理视角上还是面向一个去进行一个配置的一个统一的一个下发,这是一个简化配置一个过程。对他来是解决一个燃眉之急,另外一个点是,客户本身是在构建多俩地三中心架构体系,和 ACK ONE 这种多行管理和他一系列简化动作是不谋而合的,是一种心态的一个契合,当然也可以补充。

刚才讲的一个自动驾驶行业的一个客户,他是构建两地三中心的的一个应用。知道整个这种多活的应用,它是一个非常复杂的的架构,从它的流量的分发到应用的部署,以及数据的同步和迁移。是需要一套非常完整的的体系架构的支撑, ACK ONE 它是结合优势的网络的基础,包括 GM 技术以及结合再数据库,在多地域的附近的TS的一些能力。以及加上的应用上的这种版本管理以及应用的优先级等等一系列的能力,和他的整个的整个的 CACD 的系统可以完整地集成在一起。极大的提升整个客户的业务发布的效率,估计他可能要20天它才能完成一个应用发布,今天他可能一天可以发出几次。同时还可以追溯这些都能够在 ACK ONE 的一个能力的下来实现。 ACK ONE 是整合 RO 计算存储网络数据库等等的这些能力的一个 pass 平台。但是为这种这两地三中心的可用的应用最佳时间。

比如们选自动驾驶的一个行业,会觉得自动驾驶应该是整体的 it 技术能力相对来比较领先的一些企业。对于一些传统企业或者二级能力相对来不么领先的企业来, ACK ONE 是否适用于他们或者对于自己的能力是有一定的要求。

提升一些传统行业,可能是移动互联网行业做一些手机等等这些,他们应该优势是在手机相关的一些把一些一些能力上的。对他们来,他们也要有一个非常强大的的 RS 系统它的资源供给的的一个管理的能力达。这里边,是帮助这家企业能实现他的 idc 打通,让它能无缝的一种影响的大量的算力,以及政府的建立这里边极大的简化整个的网络的配置在复杂的环境里面,如何实现这种运动之间的通讯,如何实现这些动作都会在 ACK ONE 里面提供一些基本的能力。如何去对他的整个的软件的版本的管理,通过提供的 ACREE 的的版本管理能力,还是先让它的整个的业务的标准画留存好。通过一个业务的场景,集中向分布式缓存跨越加速它整个的再继续学习经典中场景里需要的一些加速的能力。他可以把更多的精力集中在业务的场景下去专注于模型的开发一些模型的训练等等。把这些相对来是比较复杂的一些,底层的整个 IT 资源的管控管理以及把自己运回的技能由地方的 ACK ONE 来帮助他们去实现。所以对于很多的传统的 it 企业也能够使用 ACK ONE 的一些技术,极大的加速它的整个的业务的发展,更专注于业务逻辑的开发。把更多的一些一些硬件资源的定位以及网络的一些行为等等一些工作。

一个案例代表非互联网这一行业客户也是基于 ACK ONE 去搭建他整个混合云的一个计算架构。也让它的整个计算云上和云下进行打通,实现原来计算机电池是比较紧俏的,可以在一分钟内就完成自动完成五百台一个计算节点的一个弹性扩展,一天就可以实现它完整的集群环境的一个部署,让他实现比如100t b 一以上的一个规模的一个项目数据的一个分析任务,可以代表一些非互联网一些客户的一个情况。对于 ACK ONE 的一个情况。

今天也发布一款产品叫 ACK 云原生 AI 套件。在经过很多应该经过大数据云原生 AI 概念好像是阿里云首先提出

应该,就理念可能在过往的两年里面,已经得到很多的发展,或者越来越多的认同。么在生产环节或者产品化的角度,真正把它早期提出来,阿里应该是非常早期的。在两年前2020年的时候,都已经在严肃的提的一个概念。

 

九、Ai 和云原生 AI 的区别

云原生 AI  肯定是ai 的服务的,这是它的一个大的前提。云原生 AI 目前当后面介绍一下,就对它有一个非常具体的一个定义,总的来,它是要用云原生的一个技术架构和他的一套理念来帮助加速和提效 ai 能力的生产过程。使得ai的进入门槛进一步的下降,使得 ai 的能力进一步能普及到更多的,没有么多专业算法人员和专业的技术人员的企业当中。帮助更多的企业能快速的开始利用甚至生产一些他的 AI 能力来触动他的一些新的业务迭代和业务创新。这是他的原始的一个目标和原动力。

云原生套件,它实际上是在 ACK 阿里云的 complete 的容器服务。一个的基础之上提出的一块面向 ai 方向 ai 大数据方向领域的这种上层的一个增值的一组能力。把它称之为一个 ai 的套件,他目标为加速和提效整个 ai 的工程效率和生产效率的。以及底层的一些资源效率成本,它的形式是在 ack 的一个固定之上,通过一系列的可拼装和组装的的变化的。使用核架构很快地能帮搭建出和构建出的一套自己的 ai 平台。 AI 平台完全是符合自己的使用用户的习惯,它会帮助去解决底层的资源中间的任务,而任务的管理调度以及性能上的加速和计算和数据之间的性能优化等这些比较基础的,但是非常本质重要的一些问题,使得可以客户的算法工程师也好,或者是数据科学家也好能够快速地开始他的它的深度学习的任务开展它的 ai 的服务的生产,以及开始把它的 ai 能力推向他的一个在线服务等等的一个过程。所以它是一个组件化的,可拼装的,扩展的,一个架构,来跑在集群之上

同样也给介绍一个案例,它是怎么使用云原生 AI 套件,包括它解决企业面对哪些问题。

为什么现在业界对于云原生 AI 来到底有些什么样的一个走势可以从一些三方的一些预测,或者机构来来给他寻到一些端倪。比如3cs 2200一年的年度调查报告里面,96%的受访企业正在使用,或者正在评估使用,或者在里面有相当多的客户和用户是在考虑把他 AI 的相关业务放在背上去跑。曾经就有一个预测是到2023年的时候,70%的 ai 应用,将基于容器和 service 云原生技术来进行开发和运行。在现实过程中,在研发阿里云和 ACK 过程中,发现越来越多用户希望在 coordinate 群去管理它的 CPU 的资源,去运行它的深度学习和大数据任务。这些用户的开发生产和使用 ai 的能力的时候,碰到很多共性的挑战。基本上包括像 ai 的开发门槛比较高,沟通效率低,成本又非常高昂,由其他的各种软件的硬件环境的维护非常复杂。计算资源分配很不均匀。更不要跟数据或存储发生关系的时候,它接入的繁琐维护的复杂度等一系列的问题。从根本上去解决问题, ai 服务的生产环境,必须要从之前很流行的这种每个数据科学家分几块 gpu 卡的这种单打独斗的小作坊模式。资源池化 ai 工程平台化和多角色协作的模式去升级。

事实上已经有不少的客户,在尝试利用云原生的技术来构建和因为他们的 ai 应用平台。但是随着深入到 ai 生产过程中的进到深水区之后,碰到更多的难题。而最典型的比如像 GPU 的利用率非常低。虽然是很贵的一个设备,采购很多 GPU ,但是他真正用于生产某些训练时候,发现他的用率会很低的。不是训练的扩展性非常差。 AI 作业的弹性,他跟训练数据的访问的速度,以至于他以及模式layout的的一个一体化的流水线的体验,还有团队的协作。对 AI 基础能力的一些共享等等非常多的困难摆在面前,而且都是非常有难度的一些困难。

为帮助此类希望用 AI 和原声的的技术客户就在 ACK 的基础上, AI 的产品它能达到效果,对于客户来,只要它拥有一个 ACK 的一个集群或者任何一个标准的工业集群。就可以使用套件快速定制。定制化搭建出一个自己的平台。会把数据科学家的算法工程师从繁杂低效的环境管理,资源分配,任务调度等的一些工作里面解放出来。让他们可以把更多的精力留给愉快的一个过程。 ACK ,实际上对云原生应该给出一个明确的定义,充分利用云的资源弹性,一个算力标准化的服务,以及容器自动化服务等云原生技术手段。为能力提供工程效率高,成本低可扩展,可复制的端到端的解决方案。概念提到,早在两年前就明确的提出一个概念,而且围绕它的核心场景参考的技术架构和,是希望通过的全套的。AR全景图,能帮助权限领域有具体的一个定义和可落地的路线图。到今年通过 ACK 云原生套件的产品,真正地把过往的在这方面积累的经验和最佳时间出来。帮助更多的用户来很快的去找到他原来的两个核心领域。,第一个持续的优化和资源的效果,二个是高效的运行,他的 AI 等公益工作复杂。

涉及到客户这块,第一个是国内某一个自动驾驶的一个非常有名气一个明星的一个自动驾驶公司。他们是在 ACK 的集群上构建的ai平台。云原生 AI 套件的,像 GPU 共享调度像一个数据的编排和访问加速能力。使得他们的整个的日常的 AI 分布式训练速度最高可以提升300%。同时,也大幅度降低云端 gpu 的使用的成本加快云端数据驱动的迭代效率,而且使得 gpu 的效率有大幅的提升。

另外还有一些像互联网的的典型的用户,就有一款在年轻人里面非常流行的元宇宙的社交 app 。他们实际上是基于 ACK 应该套件构建全套的自己的ai平台。实现 gpu 的大规模 GPU 进行统一弹性维和任务的管理。所以他们活动获得非常好的一个效果,包括像 gpu 利用率可以提升44%。成本节约12%。最重要的是他们可以使得自己的 ai 模型的迭代效率提升2~5倍。这些实际上想通过 AI 云原生 AI 套件,帮助这些客户得到一些最核心的一些提升。第一 AI 的工程效率的提升,第二的 GPU 代表的这种大规模的医疗资源的利用效率的利用率的提升,第三是的 AI 的训练或者推理的性能的提升。

比如一家企业里如果使用云原生 AI 套件,哪些岗位的个开发者会跟产品有一个比较密切的联系,比如刚刚提到算法或者是科学家对产品使用来,给他们带来的一些一些价值的提升,或者带来一些能力的一些解放等等,会有一些不一样的区别

AI 套件它的黄金搭档肯定是在鼓励的容器的一个基础之上。所以他实际上面对的或者是能受益的用户群体有不同的角色,来分来看

从最上层来像算法工程师或者是数据科学家,他们实际上最直接的把他们解决,环境的一致性的维护。 Gpu 资源的管理和调度,以及整个生产效率,流水线上的一致性的体验和数据数据的管理等等这一系列运维的的一些复杂度。对于一个数据科学家和上市公司来,他所要做的根据原生  AI  套件快速构建,拼装出自己的一个 AI 平台之后要停之后就可以开始选择,他认为他希望用的butterfly或者其他的一些计算框架开始提交他的训练任务,在这之前他也可以很自由地去开出他的的开发环境,来编去去调试它的代码。开始提交他的,在GPU 集群里面开始跑训练任务。当他的这种模型训练到一定的精度的程度上,它可以选择一些模型版本,很快的就把她去同样部署到容器里面去把它变成一个在线的服务。

对他们往下来,还会一个群体是容器平台的运维员或者是 AI 平台的运维人员。因为该平台用于实际上是比较夹心层的一群人就像上面有数据科学家估算公式提出一些非常要求高,但是又非常听上去不太合理的一些诉求。对下,它要去去调动整个的资源层的运营团队和资源层的提供的团队。他还要去用像一些容器等等的一些云原生的最新的技术来把这些资源很好地管理起来。在网上去提供这些算法工程师和数据科学家能看得懂符合它的传统使用习惯的一些业务逻辑或者是工具。所以它需要构建一个复杂的 ai 平台会越加复杂,因为平台,从白手起家从零开始是非常困难的。而且效率是很低的,他有 AI 套件之后,它可以会很快地结合自己公司内部的组织情况,资源情况,对战的激烈情况。很快地构建出自己的一套 AI 平台。最关键它可以带上不断的通过标准的 api 标准的这种流程,来进行一个定制和扩展。对于 AI 是的一个好处,再再往下的像 f 的资源的管理人员或资源的提供提供提供者。由于 AI 套件在  gpu 等一类的自然的统一管理运维,调度资源分配上面,做很多的内置的一些基础能力。他们完全可以利用这部分的能力。去很好的去优化整个资源的使用成本。同时也在资源调度方面做很多很多的扩展,包括多数情况下面资源的弹性的配合。把资源分配的优先级等等这些东西都是会大大的去改善整个集群资源里面的利用的效率的的一个情况。更好的更灵活地帮助他实现企业内部的各种业务上的一个要求或者是一些限制。

十、ACK 到 ACK ANYWHERE带来最大的价值

首先是一个 ANYWHERE 的一种理念或者是一种形态,既然是 ANYWHERE 能够在企业任何校园的地方提供一个统一的 ACK 为标准界面的一套容器的基础设施,让企业的客户,能根据自己的业务或者数据管控的一些需求。合适的位置,或者是中心去选择开放的一致性的一个能力, its gonna work 对核心的一个价值,按照里面也有一个点, ANYWHERE 里面还有 any 。案例希望通过去表达,通过 ACK 能实现任务的一些负载在容器之上能长出来。实现 ACK 能够承载无限的一个一个一个定位,这里面就包含刚才我提到的这种在线在线业务为服务。 ai 和大数据的应用,包括这种边缘的 LG 的这些应用,都是承载无限的一个具体的体现,我是我对 ACK ANYWHERE的解读或者一个理解。

ACK ANYWHERE概念是在云原生发展的趋势前列的一个也是非常对的的一个大的趋势。它的触达的能力,帮助客户有更广的出彩的能力触达不光是形态上的触达,因为他可以 take care 各种各样的而容器集群的一个形态,也可以触达到更广的地域上面去。不管的集群是在哪里,更广的触达能力,实际上代表的是更多的机会。更多的机会实际上对于一个 it 的来,它最终服务于什么业务对他的业务来更多的业务创新的想象空间。比如现在的这些业务能力是否有更广的,交付的触达能力是非常关键的一件事情,尤其是在现在时代的背景之下,在疫情的限制之下,触达能力和寻找机会的能力,更大的一件,更重要的人变得更迫切的一件事情。ACK ANYWHERE以及 ACK ONE 一个产品实现,实际上帮助客户找到一个扩展战术的能力,同时,不光是把拿出去,而且还是一种高效的,统一的,标准化的的一个管理的能力。使得在触达更多触达的同时,可以以一个非常好的高校的统一体验的一个方式跟现有的或者已有的一些资产投入还去投入能继续能保持它。也对于很多企业来也是非常重要的一件事情,所以我觉得虽然是一个概念和一款产品,实际上对于企业 it 和企业业务本身来,实际上是一个非常甚至超过一些技术上的一些一些一些贡献或者是作用。

ACK ANYWHERE是在过去以 ACK 的产品成熟能力就像儿勾结出来的,更广泛的的一个高级的一个能力,,一共有一个标准的横截面提供面向分布式云的多级的统一的平台的 ACK ONE 。是可以让任意的基础设施可以把这词已经进行,都能提供下影响力级别的的的支持队 adc ,是提供把云上的整个的好可以把 distribution 的能力能赢下的 idc 集群好,也通过下边缘的一些能力也能复,也不能一些 Adc 集群。总通过 ACK ANYWHERE ,只能够带来整个简化整个的的弹性。简化整个跨地域的一种管理。优化多级的资源调度。还进出去备份及恢复等的能力。为的为整个的以对他的所谓体系的的原声的的基础设施提供。更强的,获得更广泛的把更容易使用的 ACK ANYWHERE 产品叫做能力。


十一、心目中对于容器以及它未来的整个的想象空间

容器作为集装箱的技术,在过去的5年里面是行业里边最火热的技术,而且是对整个 it 行业的紧急开发等交互交互,对性价比是一个非常天赋的技术,从2007年到现在,也能看到各行各业对整个东西技术的技术是越来越高,它不同的调查里面都能看到整个。不同的级别的公司,对问题以及 k8s 这种都在日益增高。 ACK ONE 等等技术会是越来越丰富的去改变未来的  IP 面向未来的这些 ip 的多地域管理,容器技术一定是一定是未来云计算技术的中流砥柱,也一定会是更加有更大的蓬勃的发展。

容器,早年间都把它以集装箱一个形象的比喻来描述它。从今天来看,过完五六年的一个发展以容器为代表的技术对战,管它叫云原生技术对战。他已经远远超过集装箱一个范畴。如果仍然用集装箱概念,他整个云原生的技术展,更像是一个已经快要触达联通全球的一个物流系统或者海运的一个系统和调度系统。他已经连通各个地域各个场景。用一种标准化的方式高效的方式来管理和分配着的 ip 资源。在上面浇覆着的 ip 能力和 it 服务。所以如果回过头来,把云原生来讲,云原生的技术实际上在我看来在短期内或者在可见的时间之内,他一定会成为就使用云用好云的一个标准化的一个界面。上层的应用开发人员或者 it 人员。可能标准的使用容器为代表的云原生的技术。去最大化的最合理的,用好云的一个资源和基础能力。而云的这种技术能力的提供也会尽最大能力。用云原生的技术把自己的非常强大的优势和能力给释放出去做交付出去。

而事实上的容器和云原生技术以及架构,也会深刻地影响到现有的或者过往。20年来的 it 的架构和企业应用的架构。所以影响力会远远超过云原生里面的语言的范畴。他可能是对整个 it 架构应用架构的一次重大的一个改造和一个升级的一个机会,这件事情也肉眼可见是在发生中的。不管是的把微服务架构,不管是 serveless 的形态,他们远远超出一个技术本身的的一个一个单项技术本身的一个意义和范畴。他会深刻地带来 it 架构的一个变革。

集装箱也好,港口也好,整个物流系统也好,确实是能够非常清晰地让能够感受到容器技术的更实体化的去有点情绪映射,包括阿里也是对外也有过几个发布的一个论点这种技术在未来更关注的几个方向,认为是可能首先是极致的调和极致的资源成本的一个节约能力,能够帮助,因为他越来越承载更多的这种负载类型和应用架构,整个企业的成本的治理会在上面逐渐的去延伸出来,是容器技术会要继续去关注去去解决的,包括今天也发布云原生 AI 整个 AI 市逐渐会成为企业的生产力。如果成为企业的生产力,它是比较工程化。工程化 AI 的产品,它可以在整个过程中去帮助整个的企业去将 ai 作为生产力去采用的一个非常关键的路径上的一个缩短,这是今天产品也是在发生过程中它也是未来,也是在发生过程中,包括也会有这种极度的这种复杂的不同的集群,不同的地域,一些综合的一个治理,也是实现一个智能自治。认为通过 ACK ONE 上一些多集群的管理,或者是把人整跨云,把 IDC 一个管理和包括一些低成本的产品能力的下沉或者安全能力的一个下沉,包括云上弹性的一些费用,这都是智能自制的一个手段,也是未来容器技术会继续演进的一个方向,最后我可能可能会认为,安全合规也会是整个技术在进步的过程中去非常需要去容器做出一些事情的,这里面也会像赛克斯整个体系去演进,这里面就涉及到一些流量的管理,包括一些性能包括这种客观性的能力变化。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
16天前
|
存储 Kubernetes Cloud Native
云原生之旅:Kubernetes 集群部署实践
【8月更文挑战第4天】本文将带领读者进入云原生的世界,通过实战演练,深入理解如何在云端构建和部署一个 Kubernetes 集群。我们不仅会探讨理论知识,更会通过代码示例,手把手教你从零开始搭建自己的 Kubernetes 环境。无论你是云原生新手,还是希望加深对 Kubernetes 的理解,这篇文章都将是你的不二选择。
|
4天前
|
Kubernetes 监控 容灾
ACK One舰队管理:企业级多集群管理解决方案
ACK One舰队管理是阿里云为您提供的强大的多集群管理方案,功能众多:GitOps应用分发、多集群网关、多集群Service、全局可观测、服务网格、统一权限管理等,方便您轻松应对混合云、多集群、容灾等场景的问题,简化多集群管理。
|
5天前
|
Kubernetes 安全 Serverless
Kubernetes云原生问题之在Serverless Container中,Pod运行如何解决
Kubernetes云原生问题之在Serverless Container中,Pod运行如何解决
36 5
|
5天前
|
Kubernetes Cloud Native 安全
Kubernetes云原生问题之GKE Autopilot 与现有 Kubernetes 生态的兼容度如何解决
Kubernetes云原生问题之GKE Autopilot 与现有 Kubernetes 生态的兼容度如何解决
23 4
|
12天前
|
Kubernetes 监控 Cloud Native
eBPF技术大揭秘:一张全景图彻底改变Kubernetes问题排查,助你成为云原生时代的超级英雄!
【8月更文挑战第8天】在云原生时代,Kubernetes作为容器编排的标准,其问题排查变得日益复杂。eBPF技术无需改动内核即可编写高效、安全的内核程序,实现系统细粒度观测与控制。近期发布的基于eBPF的Kubernetes问题排查全景图,展示了如何利用eBPF监控资源使用、网络性能及调度策略等,例如通过eBPF程序监控CPU使用率。此全景图有助于快速定位如高CPU使用率等问题所在Pod,进而优化配置或调整调度。
38 8
|
5天前
|
Kubernetes Cloud Native API
Kubernetes云原生问题之Kubernetes帮助业务应用较少关注底层基础设施差异如何解决
Kubernetes云原生问题之Kubernetes帮助业务应用较少关注底层基础设施差异如何解决
20 1
|
12天前
|
运维 Kubernetes Cloud Native
OpenKruise:云原生应用自动化的超级引擎,让Kubernetes焕发超能力!
【8月更文挑战第8天】在现代云计算中,云原生应用借助Kubernetes实现了标准化部署。OpenKruise作为扩展工具库,增强了Kubernetes的功能,提供自动化管理复杂应用的能力。通过兼容的控制器、CRDs及Operator模式,OpenKruise简化了应用操作。用户可通过Helm安装,并利用如CloneSet等功能高效复制与管理Pods,从而专注于业务开发而非运维细节,提升云原生应用的灵活性与效率。
34 6
|
12天前
|
运维 Kubernetes 监控
云原生时代的运维革新:Kubernetes的自动化之旅
在云原生技术不断演进的今天,Kubernetes已成为容器编排的事实标准。本文将深入探讨Kubernetes如何通过自动化工具和实践,为运维团队提供高效率、高可用性的解决方案,从而推动运维工作向更高效、智能化的方向转型。
32 6
|
13天前
|
运维 Kubernetes 监控
云原生时代的运维革新:Kubernetes 在现代 IT 架构中的角色
随着云计算的不断演进,传统的运维模式已逐渐不能满足快速迭代和弹性伸缩的需求。本文将深入探讨 Kubernetes 作为容器编排工具如何引领运维领域的变革,并展示其在现代 IT 架构中的应用价值。通过实例分析,我们将了解 Kubernetes 如何优化资源管理、自动化部署和提高系统可靠性,同时指出实践中可能遇到的挑战及应对策略。
|
20天前
|
Kubernetes Cloud Native 微服务
探索云原生技术:Kubernetes在微服务架构中的应用Python编程之旅:从基础到进阶
【7月更文挑战第31天】随着云计算技术的迅猛发展,云原生概念应运而生,它代表了一种构建和运行应用程序的全新方式。本文将通过实际代码示例,深入探讨Kubernetes这一云原生关键技术如何在微服务架构中发挥其强大的作用。我们将从容器化开始,逐步过渡到Kubernetes集群的搭建与管理,最后展示如何部署和管理一个微服务应用。
32 2

热门文章

最新文章

推荐镜像

更多