如何安装 ACK 云原生 AI 套件| 学习笔记

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 快速学习如何安装 ACK 云原生 AI 套件

开发者学堂课程【5分钟玩转阿里云容器服务如何安装 ACK 云原生 AI 套件】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/1038/detail/18153


如何安装 ACK 云原生 AI 套件

 

今天我们带大家玩转的是容器服务之云原生AI套件安装。

云原生AI套件,通过数据计算类任务的编排、管理以及对各种异构计算资源的容器化统一调度和运维,显著提高 GPU/NPU 等计算集群的资源使用效率和AI工程交付速度。阿里云容器服务 ACK 以组件化、可拼装、可扩展、可定制化的灵活方式,提供了云原生 AI 能力的产品支持。下面我将给大家带来云原生 AI 套件的安装操作介绍。

当前大家看到的是我们 ACK 集群页面,在左侧的菜单栏我们选择应用,然后选择云原生 AI 套件,点击一键部署,进入云原生 AI 套件部署页面。

image.png

此时我们看到的是云原生 AI 套件,可供大家选择使用的组件。弹性训练是基于 ACK 弹性调度,为训练任务提供弹性伸缩能力的组件。弹性推理,是基于 ACK 弹性调度,为在线推理服务提供弹性伸缩能力的组件。

fluid的数据加速是基于云原生的分布式数据集编排和加速引擎,主要服务于云原生场景下数据密集型应用,例如大数据应用, AI 应用,调度组件针对 AI 和大数据的特性提供了支持批量任务调度、 GPU 共享调度、 GPU 拓扑感知调度等策略,可以有效提升集群的资源利用率。

arena 基于云原生的机器学习轻量级解决方案,支持数据准备,模型开发,模型训练模型预测的完整生命周期,可以有效提升数据科学家工作效率。即为大家提供了命令行和 SDK 两种使用方式。

image.png

控制台包括了开发控制台和运维控制台。通过控制台可以为大家带来云原生 AI 套件,更加便捷的基于 UI 的使用方式。安装控制台时,我们首先要为我们的 RAM 账号进行授权,之后我们可以选择运维控制台和开发控制台的访问方式。这里我们选择公网域名的方式。

image.png

控制台使用了关系型数据库。当前我们提供了集群内置 MySQL 和阿里云 RDS 两种方案。为了保证数据的高可用,生产系统建议大家选择阿里云 RDS 工作流是基于 coupon flow pipeline 为大家提供任务编排、实验管理和模型追溯能力的组件。kubeflow pipeline 使用了对象存储,当前我们提供了集群内置 mio 和阿里云 OSS 两种方案。为了保证数据的高可用,生产系统请大家选择阿里云 OSS 方案。

image.png

监控组件是为大家提供资源和任务层面的,具体监控的数据可以在控制台查看。选择完所有组件后,点击云原生当 AI 套件部署按钮即可以进入部署环节。前面我们能看见所部署组件的列表,当顶部的运维控制台和开发控制台显示就绪后,我们可以开始与原生 AI 套件的使用。

image.png

这里我们首先点击运维控制台的链接。运维控制台首先为我们展示的是整个集群的信息,这里面包括节点级的信息和任务级的信息。运维控制台的左侧分别是 resource quota user dataset 和 elastic job 。

image.png

这里我们点击 user 选择一个账户,系统中默认会有一个管理员账户,我们复制账户的 token 用来开发控制台的登录。

image.png

我们回到控制台页面,点击开发控制台链接,输入我们刚刚复制的 token ,此时我们已经进入了云原生 AI 套件的开发控制台,控制台的首页展示了整个集群的信息和任务的状态。在开发控台的左侧,分别是数据配置 Notebook 提交任务列表、定时任务、模型管理,评测任务 coupon flow pipeline。

image.png

我们点击 Notebook 来去创建一个 Notebook ,输入 Notebook 的名称,选择一个 Notebook 的镜像,选择命名空间。在下面我们可以配置镜像拉取的凭证、数据的数据源等信息。右侧我们可以配置 Notebook 的资源信息,点击创建 Notebook 。

image.png

此时展示的是 Notebook 列表。我们可以在这里看到当前我们所创建 Notebook 的状态。现在 Notebook 已经处于 running 状态,

我们点击名称下面的链接,可以进入到 Notebook 。

image.png

云原生 AI 套件的 Notebook 与大家所熟知的使用方式保持一致。在这里我们的数据科学家就可以按照他的方式来开始他的模型或者数据的开发工作。

image.png

我们再回到开发控制台,点击提交任务。在提交任务这个页面里面,我们可以提交一次训练任务。当前在开发控制台支持的任务类型有 TF 单机 ,TF 分布式,pytorch单机,pytorch分布式。在提交任务时,我们可以指定命名空间、数据源配置,代码配置镜像拉取凭证、输出路径、执行的脚本等信息。在右侧我们可以配置所执行的 worker 的数量,镜像信息,资源信息。在右下方,我们可以指定更高级的云原生相关的配置信息。

image.png

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
7天前
|
Kubernetes Cloud Native Docker
云原生时代的容器化实践:Docker和Kubernetes入门
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术成为企业提升敏捷性和效率的关键。本篇文章将引导读者了解如何利用Docker进行容器化打包及部署,以及Kubernetes集群管理的基础操作,帮助初学者快速入门云原生的世界。通过实际案例分析,我们将深入探讨这些技术在现代IT架构中的应用与影响。
30 2
|
7天前
|
Kubernetes 监控 负载均衡
深入云原生:Kubernetes 集群部署与管理实践
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术以其弹性、可扩展性成为企业IT架构的首选。本文将引导你了解如何部署和管理一个Kubernetes集群,包括环境准备、安装步骤和日常维护技巧。我们将通过实际代码示例,探索云原生世界的秘密,并分享如何高效运用这一技术以适应快速变化的业务需求。
29 1
|
12天前
|
运维 Kubernetes Cloud Native
Kubernetes云原生架构深度解析与实践指南####
本文深入探讨了Kubernetes作为领先的云原生应用编排平台,其设计理念、核心组件及高级特性。通过剖析Kubernetes的工作原理,结合具体案例分析,为读者呈现如何在实际项目中高效部署、管理和扩展容器化应用的策略与技巧。文章还涵盖了服务发现、负载均衡、配置管理、自动化伸缩等关键议题,旨在帮助开发者和运维人员掌握利用Kubernetes构建健壮、可伸缩的云原生生态系统的能力。 ####
|
13天前
|
存储 运维 Kubernetes
云原生之旅:Kubernetes的弹性与可扩展性探索
【10月更文挑战第32天】在云计算的浪潮中,云原生技术以其独特的魅力成为开发者的新宠。本文将深入探讨Kubernetes如何通过其弹性和可扩展性,助力应用在复杂环境中稳健运行。我们将从基础架构出发,逐步揭示Kubernetes集群管理、服务发现、存储机制及自动扩缩容等核心功能,旨在为读者呈现一个全景式的云原生平台视图。
26 1
|
17天前
|
Kubernetes 负载均衡 Cloud Native
云原生应用:Kubernetes在容器编排中的实践与挑战
【10月更文挑战第27天】Kubernetes(简称K8s)是云原生应用的核心容器编排平台,提供自动化、扩展和管理容器化应用的能力。本文介绍Kubernetes的基本概念、安装配置、核心组件(如Pod和Deployment)、服务发现与负载均衡、网络配置及安全性挑战,帮助读者理解和实践Kubernetes在容器编排中的应用。
48 4
|
18天前
|
Kubernetes 监控 Cloud Native
云原生应用:Kubernetes在容器编排中的实践与挑战
【10月更文挑战第26天】随着云计算技术的发展,容器化成为现代应用部署的核心趋势。Kubernetes(K8s)作为容器编排领域的佼佼者,以其强大的可扩展性和自动化能力,为开发者提供了高效管理和部署容器化应用的平台。本文将详细介绍Kubernetes的基本概念、核心组件、实践过程及面临的挑战,帮助读者更好地理解和应用这一技术。
53 3
|
21天前
|
运维 Kubernetes Cloud Native
云原生入门:Kubernetes和容器化的未来
【10月更文挑战第23天】本文将带你走进云原生的世界,探索Kubernetes如何成为现代软件部署的心脏。我们将一起揭开容器化技术的神秘面纱,了解它如何改变软件开发和运维的方式。通过实际的代码示例,你将看到理论与实践的结合,感受到云原生技术带来的革命性影响。无论你是初学者还是有经验的开发者,这篇文章都将为你开启一段新的旅程。让我们一起踏上这段探索之旅,解锁云原生技术的力量吧!
|
6天前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
|
7天前
|
运维 Kubernetes Cloud Native
云原生技术:容器化与微服务架构的完美结合
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术以其灵活性和高效性成为企业的新宠。本文将深入探讨云原生的核心概念,包括容器化技术和微服务架构,以及它们如何共同推动现代应用的发展。我们将通过实际代码示例,展示如何在Kubernetes集群上部署一个简单的微服务,揭示云原生技术的强大能力和未来潜力。
|
9天前
|
消息中间件 存储 Cloud Native
云原生架构下的数据一致性挑战与应对策略####
本文探讨了在云原生环境中,面对微服务架构的广泛应用,数据一致性问题成为系统设计的核心挑战之一。通过分析云原生环境的特点,阐述了数据不一致性的常见场景及其对业务的影响,并深入讨论了解决这些问题的策略,包括采用分布式事务、事件驱动架构、补偿机制以及利用云平台提供的托管服务等。文章旨在为开发者提供一套系统性的解决方案框架,以应对在动态、分布式的云原生应用中保持数据一致性的复杂性。 ####

热门文章

最新文章