阿里云容器服务 ACK 产品技术动态(202307)

简介: 容器服务 Kubernetes 版 ACK【变更】Feature:ACK 托管集群标准版更名为基础版:ACK 集群“标准版”集群更名为“基础版”,涵盖 ACK 托管版、ASK 集群、ACK 边缘集群。OpenAPI 中该字段保持不变。基础版用于个人学习和测试,正式环境请使用 Pro 版本。

容器服务 Kubernetes 版 ACK

【变更】

Feature:ACK 托管集群标准版更名为基础版

ACK 集群“标准版”集群更名为“基础版”,涵盖 ACK 托管版、ASK 集群、ACK 边缘集群。OpenAPI 中该字段保持不变。基础版用于个人学习和测试,正式环境请使用 Pro 版本。点击查看文档详情


【集群运维】

Feature:ALB Ingress Controller 发布 v2.9.0-aliyun.1 版本

ALB Ingress Controller 发布 v2.9.0-aliyun.1 版本。点击查看文档详情


Feature:Terway v1.5.5 发布

Terway v1.5.5 全面发布,支持为弹性网卡配置白名单。点击查看文档详情


Feature:备份中心备份计划功能优化

支持以排除方式选择命名空间,支持拷贝创建。点击查看文档详情


容器服务 Serverless 版 ACK Serverless

【变更】

Feature:原 ASK 正式改名为容器服务 Serverless 版(ACK Serverless)

容器服务 Serverless 版(ASK)正式更名为容器服务 Serverless 版(ACK Serverless),同时 ASK 集群也更名为 ACK Serverless 集群。Kubernetes 集群及节点免运维,基于应用实际用量按秒计费,支持秒级弹性伸缩。点击查看文档详情


【新功能】

Feature:支持 KServe 组件,加速 AI 模型的部署

KServe 是一个基于 K8s 的机器学习模型服务框架,提供简单的 K8s CRD,可用于将单个或多个经过训练的模型(例如 TFServing、TorchServe、Triton 等推理服务器)部署到模型服务运行时。ACK Serverless 支持 一键部署 KServe 组件,提供开箱即用的模型服务,让您轻松构建自定义模型服务运行时。点击查看文档详情


Feature:支持核心组件托管,简化 K8s 集群运维

在 ACK Serverless Pro 版集群中创建的 K8s 核心组件会被托管,包括 Kube Scheduler、Cloud Controller Manager、Kube Controller Manager、Kube API Server 和 CoreDNS 等,不占用您的资源,同时降低您的集群运维复杂度。点击查看文档详情


【能力增强】

Feature:支持 Spot 实例创建加速,提升大批量 Spot 实例创建规模
ACK Serverless 提供高达 100w 核/小时的实例创建能力,可以在短时间内快速创建大量 Spark Job 等任务型并发处理实例,降低 Job 任务的排队时长,支撑大数据存算分离场景下的算力供给。文档详情


阿里云云原生 AI 套件

【新版本】

Feature:ack-kube-queue 组件发布 v0.1.12 版本

ack-kube-queue 是云原生 AI 套件提供的任务队列组件,v0.1.12 版本新增以下功能:

  • 支持对单个队列设置阻塞策略:

ack-kube-queue 支持阻塞队列功能,开启后队列将重复尝试调度位于队头的任务,直到队头的任务出队。在队头的任务出队前,不会尝试调度队中的其他任务。新版本中,除了可以在 Kube Queue Controller 中设置环境变量开启阻塞队列功能,还可以对单个 Queue 设置阻塞策略。

  • 支持配置任务出队的超时策略:

新版本中,支持 --jobrunningtimeout、--jobbackofftime 参数控制队列的任务出队策略,当任务出队并且未成功运行的时间超过 jobrunningtimeout 时,将会进入 backoff 状态,backoff 状态在 jobbackofftime 后结束,任务将重新进入队列排队。该特性可用于缓解,当大任务由于资源碎片无法调度时,小任务由于获取不到足够 Quota 无法出队,而导致的队头阻塞问题。目前仅 Tfjob、Pytorchjob 支持此功能。


Feature:ack-fluid 组件发布 v1.0.2 版本

ack-fluid 组件是云原生 AI 套件提供的分布式数据集编排和加速引擎,v1.0.2 版本新增以下功能:

  • 支持 Fluid 控制面组件安全加固
  • 支持 ECI 实例本地盘作为缓存存储介质
  • 支持定时 DataLoad 缓存预热任务


【新功能】

Feature:容器智能运维服务 CIS 支持 GPU 节点自助诊断

ACK 集群提供节点级别的 GPU 诊断功能,供您进行部分 GPU 相关问题的故障排查。如果您在 ACK Pro 版集群中使用 GPU 节点时遇到问题,可以启用 GPU 节点自助诊断,采集 GPU 诊断的基础指标进行问题排查。点击查看文档详情


Feature:ACK 调度器支持 IP 感知调度和拓扑调度等功能

  • IP 感知调度:当 Pod 调度到某节点上,并且由于可用 IP 不足无法启动,该节点将被标记为缺少 IP 状态并被拉黑五分钟,以防止大量 Pod 由于 IP 不足启动失败。目前仅对 ACK 集群 Pro 版使用 Terway 网络插件的情况生效。
  • 拓扑调度:通过特殊协议申明一批需要调度到相同拓扑域下的 Pod,这批 Pod 将自动在不同的拓扑域下进行重试,直到找到可行的拓扑域。通过该功能可实现将 Pod 调度到同一部署集下,从而实现低延时或高可用。
  • 弹性配额资源信息:CapacityScheduling 支持在多层级弹性配额(ElasticQuotaTree)的状态查询中,查看当前各个弹性配额(Quota)下的资源请求量以及资源使用量等信息。

阿里云服务网格 ASM

【新功能】

Feature:控制面金丝雀升级 v2.0 版本

简化支持基于修订与标签的升级模式,以更稳定安全的方式执行新版本控制面的金丝雀升级。点击查看文档详情


Feature:简化全局命名空间的标签同步管理

为全局命名空间加入所属 Kubernetes 集群的支持,可以选择性地向不同集群同步不同的命名空间标签。在 ASM 控制台侧提供命名空间标签  istio.io/rev 的管理, 以简化在金丝雀升级过程中不同版本代理的注入。点击查看文档详情


Feature:为网格资源操作配置审计告警

开启网格审计功能后,通过配置 SLS 的告警,可以为网格资源的变更行为添加审计告警能力,在重要资源变动时及时发生告警通知到用户。点击查看文档详情


功能增强】

Feature:自适应配置推送优化支持对出口网关的配置

自适应配置推送优化功能开启后,集群中会部署名为 istio-axds-egressgateway 的出口网关,为此出口网关添加了修改配置的功能。点击查看文档详情


Feature:支持集成外置 OPA 执行引擎

支持外置 OPA 执行引擎。与 Sidecar 模式相比,外置 OPA 可以资源占用更低、应用无需重启即可接入,接入粒度更细致。点击查看文档详情


Feature:新增网关级别的日志页面

您可以单独查看某个特定网关的原始日志和日志仪表盘。点击查看文档详情


阿里云分布式云容器平台 ACK One

【新功能】

Feature:onectl 支持集群注册

通过 onectl 命令行工具,简化注册集群的创建/接入/权限设置/组件安装点击查看文档详情


Feature:注册集群实现 IDC 中 K8s 集群以 Serverless 方式使用云上 CPU 和 GPU 资源

通过注册集群实现 IDC 中 K8s 集群以 Serverless 方式使用云上 CPU 和 GPU 资源。点击查看文档详情

相关实践学习
使用ACS算力快速搭建生成式会话应用
阿里云容器计算服务 ACS(Container Compute Service)以Kubernetes为使用界面,采用Serverless形态提供弹性的算力资源,使您轻松高效运行容器应用。本文将指导您如何通过ACS控制台及ACS集群证书在ACS集群中快速部署并公开一个容器化生成式AI会话应用,并监控应用的运行情况。
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
7月前
|
运维 Kubernetes Cloud Native
智联招聘 × 阿里云 ACK One:云端弹性算力颠覆传统 IDC 架构,打造春招技术新范式
在 2025 年春季招聘季的激战中,智联招聘凭借阿里云 ACK One 注册集群与弹性 ACS 算力的深度融合,成功突破传统 IDC 机房的算力瓶颈,以云上弹性架构支撑千万级用户的高并发访问,实现招聘服务效率与稳定性的双重跃升。
|
4月前
|
存储 Kubernetes 网络安全
关于阿里云 Kubernetes 容器服务(ACK)添加镜像仓库的快速说明
本文介绍了在中国大陆地区因网络限制无法正常拉取 Docker 镜像的解决方案。作者所在的阿里云 Kubernetes 集群使用的是较旧版本的 containerd(1.2x),且无法直接通过 SSH 修改节点配置,因此采用了一种无需更改 Kubernetes 配置文件的方法。通过为 `docker.io` 添加 containerd 的镜像源,并使用脚本自动修改 containerd 配置文件中的路径错误(将错误的 `cert.d` 改为 `certs.d`),最终实现了通过多个镜像站点拉取镜像。作者还提供了一个可重复运行的脚本,用于动态配置镜像源。虽然该方案能缓解镜像拉取问题,
567 2
|
10月前
|
存储 人工智能 Kubernetes
ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践
本文介绍了如何利用阿里云容器服务ACK推出的ACK Gateway with AI Extension组件,在Kubernetes环境中为大语言模型(LLM)推理服务提供智能路由和负载均衡能力。文章以部署和优化QwQ-32B模型为例,详细展示了从环境准备到性能测试的完整实践过程。
|
11月前
|
Cloud Native Serverless 数据中心
阿里云ACK One:注册集群支持ACS算力——云原生时代的计算新引擎
阿里云ACK One:注册集群支持ACS算力——云原生时代的计算新引擎
347 10
|
10月前
|
安全 持续交付 云计算
课时5:阿里云容器服务:最原生的集成Docker和云服务
阿里云容器服务以服务化形式构建容器基础设施,大幅提升开发效率,简化应用部署流程。通过Docker容器和DevOps工具(如Jenkins),实现自动化部署与迭代,优化企业内部复杂部署问题。该服务支持GPU调度、混合云架构无缝迁移,并与阿里云产品体系无缝集成,提供安全防护、网络负载均衡等多重功能支持。凭借微服务架构,帮助企业突破业务瓶颈,提高资源利用率,轻松应对海量流量。
373 0
课时5:阿里云容器服务:最原生的集成Docker和云服务
|
11月前
|
Kubernetes 持续交付 开发工具
阿里云协同万兴科技落地ACK One GitOps方案,全球多机房应用自动化发布,效率提升50%
阿里云协同万兴科技落地ACK One GitOps方案,全球多机房应用自动化发布,效率提升50%
460 2
|
10月前
|
存储 运维 Kubernetes
容器数据保护:基于容器服务 Kubernetes 版(ACK)备份中心实现K8s存储卷一键备份与恢复
阿里云ACK备份中心提供一站式容器化业务灾备及迁移方案,减少数据丢失风险,确保业务稳定运行。
|
11月前
|
弹性计算 监控 持续交付
面对热点事件,阿里云如何通过云上弹性与容器服务帮助客户应对流量洪峰
面对热点事件,阿里云如何通过云上弹性与容器服务帮助客户应对流量洪峰
284 0
|
11月前
|
边缘计算 调度 对象存储
部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙
部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙
270 0
|
11月前
|
监控 Cloud Native Java
基于阿里云容器服务(ACK)的微服务架构设计与实践
本文介绍如何利用阿里云容器服务Kubernetes版(ACK)构建高可用、可扩展的微服务架构。通过电商平台案例,展示基于Java(Spring Boot)、Docker、Nacos等技术的开发、容器化、部署流程,涵盖服务注册、API网关、监控日志及性能优化实践,帮助企业实现云原生转型。

相关产品

  • 容器计算服务
  • 容器服务Kubernetes版
  • 推荐镜像

    更多