阿里云容器服务 ACK 产品技术动态(202312)

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 容器服务 Kubernetes 版 ACK【新功能】Feature:支持基于机密虚拟机的 AI 模型推理保护 ACK 现已支持将基于 Intel® Trusted Domain Extension(Intel® TDX)技术的 ECS 实例加入 TDX 机密虚拟机计算节点池,使集群具备 TDX 机密计算能力,实现 AI 模型的可信推理和微调,保障模型数据的机密性与完整性。结合 PyTorch 与 Intel® AMX指令集,您可以在 32 核实例上实现秒级出图的推理能力。

容器服务 Kubernetes 版 ACK


【新功能】

Feature:支持基于机密虚拟机的 AI 模型推理保护
ACK 现已支持将基于 Intel® Trusted Domain Extension(Intel® TDX)技术的 ECS 实例加入 TDX 机密虚拟机计算节点池,使集群具备 TDX 机密计算能力,实现 AI 模型的可信推理和微调,保障模型数据的机密性与完整性。结合 PyTorch 与 Intel® AMX指令集,您可以在 32 核实例上实现秒级出图的推理能力。  点击查看文档详情


【新地域】
Feature:开服华中 1(武汉)本地地域
ACK 目前已在 3 个本地地域开服,分别是南京、福州和武汉。本地地域与中心地域采用一致的飞天架构,具有小型化,一致性,低时延,低成本的特点,侧重于对本地数据处理、IT 中心架构低时延平迁上云、数据实时交互等需求场景的支持。  

阿里云云原生 AI 套件

【新版本】

Feature:ack-ai-installer 组件发布 v1.8.7 版本

ack-ai-installer 组件结合 ACK Scheduler 提供共享 GPU 调度、GPU 拓扑感知调度等能力,v1.8.7 版本中,新增支持 MPS 的共享 GPU 调度;所结合的阿里云 GPU 容器共享技术 cGPU 升级到 v1.5.5 版本。


Feature:ack-fluid 组件发布 v1.0.6 版本

ack-fluid 组件是云原生 AI 套件提供的分布式数据集编排和加速引擎,v1.0.6 版本中,数据操作支持设置资源请求/限制;支持多级亲和性调度策略自定义配置;JindoRuntime 支持加速 PV 和主机目录数据访问。


Feature:ack-kube-queue 组件发布 v0.3.3 版本

ack-kube-queue 是云原生 AI 套件提供的任务队列组件,v0.3.3 版本中,通过环境变量设置全局阻塞队列时,将会全局刷新所有 Queue 的阻塞队列模式。


阿里云服务网格 ASM


【新版本】

Feature:发布 v1.19 新版本、发布 v1.18 最新补丁版本

发布支持 Istio 1.19 版本,兼容社区最新特性, 合并处理上游社区对 CVE 的修复逻辑。发布 v1.18 最新补丁版本, 支持 Istio 1.18.6, 合并处理上游社区对 CVE 的修复逻辑。

【新功能】

Feature:新建 ASM 集群所需的 CLB 切换为按使用量计费方式

在新建 ASM 集群时, 默认将为 API Server/Istio 控制面访问创建一个私网 CLB 实例, 并且默认创建按使用量计费的 CLB 实例。
Feature:支持使用 CEL 语言设置日志过滤规则
支持使用 CEL(Common Expression Language)语言设置日志过滤规则, 在访问量较大的业务场景中,按照特定条件过滤日志,可以节约 Sidecar 代理的资源开销,并专注于关键日志内容。点击查看文档详情

Feature:简化本地限流功能的管理
增强本地限流的功能, 满足客户针对限流的一些常用场景能力, 提供图形化界面提高易用性,简化配置流程,减少操作错误


容器服务 Edge 版 ACK Edge


【新功能】

Feature:DaemonSet 工作负载支持 AdvancedRollingUpdate 和 OTA 升级模型

原生的滚动升级模型无法满足云边协同场景下的应用升级需求,如由于云边网络中断,节点 NotReady 而导致的 DaemonSet 滚动升级被阻塞,或者用户需要在边缘节点上直接触发应用的升级,而不由云端驱动(例如新能源汽车的 OTA 升级),新增的两个升级模型将解决这类问题。点击查看文档详情


Feature:多地域工作负载的定制化配置

通过新增的 YurtAppOverrider CRD,可以配合 YurtAppSet 多地域工作负载一起使用,解决不同地域内工作负载定制化配置的需求(如同一类型应用在不同地域内需要配置不同的实例数,镜像版本等)。点击查看文档详情


Feature:新上架 Raven 组件替换 edge-tunnel,支持 ACK Edge 集群云边通信
ACK Edge 集群以节点池为单位支持节点多地域分布。位于不同节点池的节点处于不同的网络域,无法直接通信。Raven 组件提供两种模式即代理模式和隧道模式分别提供跨网络域的主机网路 Http 通信和容器网络通信。点击查看文档详情


阿里云分布式云容器平台 ACK One


【文档更新】Feature:注册集群快速入门

注册集群快速入门文档为您提供注册集群的快速使用流程和文档使用指引。点击查看文档详情


【新功能】

Feature:ACK One工作流集群支持事件驱动功能

ACK One 工作流集群支持事件驱动功能,可通过监控事件触发工作流自动运行,您可以使用该功能构建事件驱动的自动化系统。事件驱动支持各种事件源,包括阿里云对象存储 OSS、阿里云消息服务 MNS、Git 代码仓库,EventBrige 等。

点击查看文档详情

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
11天前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
11天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
11天前
|
Kubernetes 算法 调度
阿里云 ACK FinOps成本优化最佳实践
本文源自2024云栖大会梁成昊演讲,讨论了成本优化策略的选择与实施。文章首先介绍了成本优化的基本思路,包括优化购买方式、调整资源配置等基础策略,以及使用弹性、资源混部等高级策略。接着,文章详细探讨了集群优化和应用优化的具体方法,如使用抢占式实例降低成本、通过资源画像识别并优化资源配置,以及利用智能应用弹性策略提高资源利用效率。
|
11天前
|
弹性计算 调度 数据中心
阿里云 ACK One 注册集群云上弹性:扩展业务新利器
随着企业数字化转型深入,传统IDC数据中心因物理容量限制,难以实现动态扩容,缺乏弹性能力。阿里云ACK One注册集群凭借其高度灵活性和丰富资源选择,成为解决此问题的最佳方案。通过与阿里云资源的整合,ACK One不仅实现了计算资源的按需扩展,提高了资源利用率,还通过按需付费模式降低了成本,使企业能够更高效地应对业务增长和高峰需求。
|
11天前
|
运维 Kubernetes Serverless
阿里云Argo X K8s玩转工作流引擎,实现大规模并行计算
本文基于2024云栖大会田双坤的演讲,介绍了Kubernetes作为云原生操作系统的角色及其在各类任务中的应用,重点探讨了Argo Workflows在Kubernetes上编排并行任务的能力。面对自建Argo Workflows的挑战,如稳定性、成本和安全性等问题,阿里巴巴云推出了全托管的Serverless Argo工作流,提供全托管、免运维、可观测和易集成的特点,显著提升了任务编排的效率和稳定性。适用于数据处理、科学计算、自动驾驶仿真等多个领域。
|
11天前
|
Kubernetes 容灾 调度
阿里云 ACK 高可用稳定性最佳实践
本文整理自2024云栖大会刘佳旭的演讲,主题为《ACK高可用稳定性最佳实践》。文章探讨了云原生高可用架构的重要性,通过Kubernetes的高可用案例分析,介绍了ACK在单集群高可用架构设计、产品能力和最佳实践方面的方法,包括控制面和数据面的高可用策略、工作负载高可用配置、企业版容器镜像服务高可用配置等内容,旨在帮助企业构建更加可靠和高效的应用运行环境。
|
11天前
|
存储 Kubernetes 关系型数据库
阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
本文源自2024云栖大会苏雅诗的演讲,探讨了K8s集群业务为何需要灾备及其重要性。文中强调了集群与业务高可用配置对稳定性的重要性,并指出人为误操作等风险,建议实施周期性和特定情况下的灾备措施。针对容器化业务,提出了灾备的新特性与需求,包括工作负载为核心、云资源信息的备份,以及有状态应用的数据保护。介绍了ACK推出的备份中心解决方案,支持命名空间、标签、资源类型等维度的备份,并具备存储卷数据保护功能,能够满足GitOps流程企业的特定需求。此外,还详细描述了备份中心的使用流程、控制台展示、灾备难点及解决方案等内容,展示了备份中心如何有效应对K8s集群资源和存储卷数据的灾备挑战。
|
11天前
|
供应链 安全 Cloud Native
阿里云容器服务助力企业构建云原生软件供应链安全
本文基于2024云栖大会演讲,探讨了软件供应链攻击的快速增长趋势及对企业安全的挑战。文中介绍了如何利用阿里云容器服务ACK、ACR和ASM构建云原生软件供应链安全,涵盖容器镜像的可信生产、管理和分发,以及服务网格ASM实现应用无感的零信任安全,确保企业在软件开发和部署过程中的安全性。
|
11天前
|
人工智能 Kubernetes Cloud Native
阿里云容器服务,智算时代云原生操作系统
2024云栖大会,阿里巴巴研究员易立分享了阿里云容器服务的最新进展。容器技术已成为云原生操作系统的基石,支持多样化的应用场景,如自动驾驶、AI训练等。阿里云容器服务覆盖公共云、边缘云、IDC,提供统一的基础设施,助力客户实现数字化转型和技术创新。今年,阿里云在弹性计算、网络优化、存储解决方案等方面进行了多项重要升级,进一步提升了性能和可靠性。
|
11天前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。

相关产品

  • 容器服务Kubernetes版
  • 下一篇
    DataWorks