阿里云 Serverless 容器服务全面升级:新增组件全托管、AI 镜像秒级拉取能力

简介: 阿里云 Serverless 容器服务全面升级:新增组件全托管、AI 镜像秒级拉取能力


6 月 1 日在阿里云峰会·粤港澳大湾区上,阿里云智能云原生应用平台总经理丁宇宣布,Serverless 容器服务 ASK 全面升级,进一步帮助企业和开发者降本提效。



Gartner 曾预测,2023 年 70% 的 AI 应用将基于容器和 Serverless 技术开发。作为云原生的重要技术组成,K8s 已经被开发者和企业广泛认可,然而其自身复杂性和陡峭的学习曲线依然让人望而生畏。


阿里云在 2018 年发布了首个 Serverless 容器服务 ASK,其本质是将容器的运行时和具体的节点运行环境解耦,让用户无需管理 K8s 节点和服务器,即可直接部署应用,大幅降低容器服务的使用门槛。目前,ASK 在容器化应用、在线业务弹性、AI/大数据计算类任务等场景中被广泛使用。



本次发布,ASK 进一步整合了阿里云基础设施的能力,在使用成本、创建效率、异构资源兼容、弹性供给保障等方面带来显著提升,解决开发者在使用 K8s 的复杂性挑战,也顺应了 AI 场景爆发下催生的新需求。


丁宇介绍,本次 ASK 升级涵盖了多个维度,包括对组件的全托管支持、AI 镜像的秒级拉取能力,还降低了客户的使用成本。具体来说:


组件全托管,零 K8s 运维成本:ASK 新增对 CoreDNS、Metrics Server 等十多个 K8s 核心组件的托管支持,提供动态容量规划能力,客户无需自行部署维护,最大化降低运维复杂度。同时,ASK 也新增了智能化风险识别能力,支持自动化升级 K8s 版本,避免升级导致的应用故障或异常风险。


极致弹性,准确率提升 80%:ASK 提供首界首创基于容器镜像缓存的 AI 大镜像秒级拉取能力,AI 应用启动时间降低 90%。并且提供端到端的弹性加速,面向AI/大数据工作负载容器化进行全栈优化,通过数据集加速提升 30% 访问性能;


此外,本次 ASK 还增强了智能弹性预测  AHPA 能力,相比人工配置,弹性准确率提升 80%;同时新增对于 GPU 的支持。


普惠算力,降价 40%:为了给客户提供更好的服务,释放技术红利,让算力更普惠,ASK 新增 U 实例规格支持,统一支持多款处理器,相比上一代主售实例降价高达 40%。


新增 SavingPlan 弹性版本,面向应用非固定波峰波谷场景,额外成本优化 10% 以上。为进一步让价格更透明,新增成本套件支持,清晰洞察弹性资源成本,让成本治理更便捷。



以数禾科技为例,这是一家为金融机构提供高效的智能零售金融解决方案的公司,对于模型的计算能力包括计算速度、计算结果准确性、计算数据实时性等,有很高的要求。


而当前的困扰是支撑模型计算的底层应用资源无法根据请求量来调整机器资源支持运算能力,这也是当前业务快速发展过程中亟待解决的痛点。同时,随着模型在线推理服务数量的增加,数禾的模型服务也变得越来越庞大、臃肿,难以管理。这种状况不仅导致了资源浪费,还增加了维护和升级的成本。


为了解决这些“顽疾”,数禾科技采用阿里云 ASK 部署线上模型,无需 K8s 节点管理,根据实时流量动态使用 POD,资源成本节省 60%;通过 ASK Knative 服务,解决了数禾模型的灰度发布和多版本并存问题;得益于ASK 自动伸缩和缩容到 0 的优势,降低运行成本,大幅提升服务可用性。


使用阿里云容器服务 Knative 和 ECI 虚拟节点配合部署,保证线上模型应对突发流量的稳定性提升的同时,又使资源利用效率显著提高,极大地节约了资源成本。”数禾科技 AI 实验室 AI 平台负责人周伟鹏表示。


为了让容器开发者和对使用 Kubernetes 部署 AI 模型业务感兴趣的用户更好地体验ASK,阿里云全新上线「基于 ASK 轻松部署企业级 Stable Diffusion」场景体验。通过 Knative 部署满足企业级弹性需求的 Stable Diffusion 服务,同时通过对该服务进行压测实验,体验 ASK 弹性能力。


扫码体验企业级弹性能力


体验地址:https://developer.aliyun.com/adc/scenario/de33e7d3065949f3b81db292b2dca5ea


为了让更多开发者感受 Serverless 技术魅力,云原生应用平台与天池联合发起 2023 年云原生编程挑战赛,过往的八年里已经有超过 5 万支战队参赛。每年都会涌现出非常多优秀的选手和出色的作品,云原生编程挑战赛已经成为云原生领域的技术风向标。


今年大赛分为三大赛道,分别解决不同场景经常会遇到的难题,包括 Serverless 冷启动,应用安全领域的插件设计,以及通过 SAE 去设计一个创新应用。大赛即将启动,36 万元现金大奖,敬请期待!



ASK 免费试用玩法再升级


目前,ASK 已加入阿里云飞天免费试用计划,为开发者、企业提供一定额度的免费试用资源。3 分钟就可以创建 Kubernetes 集群,开启容器弹性之旅。


玩法一:ASK 开发者评测正式上线

为了您能更快速、便捷地体验 ASK 产品能力,您可以在领用试用资源包后,选择下列2个给定场景中的任意一个,完整体验 ASK 产品在具体应用中的优势,并围绕 ASK 体验过程展开测评:


  • 评测地址:

https://developer.aliyun.com/mission/review/ask


一等奖:1篇最优评测,获得 Redmi Watch 3 + 开发者评测全套定制周边(鼠标垫、飞盘、帆布包、云小宝) + 阿里云社区优质评测证书 + 阿里云社区首页达人展示一周;


二等奖:5篇优质评测,获得阿里云定制双肩背包 + 开发者评测限量首发云小宝公仔 + 阿里云社区优质评测证书。


玩法二:场景体验:在 ASK 中实现弹幕服务

为了让大家体验更多 ASK 能力,特别设置体验场景——“在 ASK 中实现弹幕服务”。在本次体验中,系统自动生成ASK集群,提供业务运行环境。通过前端发送弹幕消息到HomePage,然后HomePage将弹幕信息发送到消息处理进行加工。加工完成后,页面将展示前端获取的弹幕结果。



  • 体验地址:

https://help.aliyun.com/document_detail/612667.html


更多玩法和惊喜大礼,尽在 ASK 产品升级发布会,点击此处进入直播间。

相关实践学习
使用ACS算力快速搭建生成式会话应用
阿里云容器计算服务 ACS(Container Compute Service)以Kubernetes为使用界面,采用Serverless形态提供弹性的算力资源,使您轻松高效运行容器应用。本文将指导您如何通过ACS控制台及ACS集群证书在ACS集群中快速部署并公开一个容器化生成式AI会话应用,并监控应用的运行情况。
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
5月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
667 30
|
5月前
|
人工智能 运维 安全
加速智能体开发:从 Serverless 运行时到 Serverless AI 运行时
在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向 AI 原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。
|
5月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
6月前
|
存储 人工智能 Serverless
函数计算进化之路:AI 应用运行时的状态剖析
AI应用正从“请求-响应”迈向“对话式智能体”,推动Serverless架构向“会话原生”演进。阿里云函数计算引领云上 AI 应用 Serverless 运行时技术创新,实现性能、隔离与成本平衡,开启Serverless AI新范式。
693 12
|
6月前
|
存储 人工智能 安全
函数计算进化之路:AI Sandbox 新基座
AI Agent Sandbox 是应对 AI 代理自主性风险的关键技术,提供安全隔离环境以执行代码、交互应用和处理敏感数据。它解决了三大挑战:隔离与安全、状态管理与成本、可扩展性与运维。阿里云函数计算凭借物理隔离架构、Serverless 弹性与成本优势,结合会话亲和、隔离及存储安全等创新能力,成为 AI Agent Sandbox 的理想运行时平台,助力 AI 技术安全落地与商业化发展。
|
6月前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
|
6月前
|
人工智能 Serverless API
函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代
函数计算计费方式历经三阶段演进:从按请求计费,到按活跃时长毫秒级计费,再到按实际资源消耗分层计费。背后是资源调度、安全隔离与开发体验的持续优化。尤其在AI时代,低负载减免、会话亲和等技术让计费更贴近真实价值,推动Serverless向“按需使用、按量付费”终极目标迈进。
|
6月前
|
人工智能 Serverless API
函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代
在 AI 时代,函数计算一直坚持走向“让开发者只关心业务逻辑,云厂商自动完成一切资源管理与调度”的愿景,最终让计算像水、电一样随时可得、按实际使用价值付费。
|
6月前
|
存储 人工智能 安全
函数计算进化之路:AI Sandbox 新基座
AI Agent 的兴起催生了一种全新的、独特的云工作负载类型。它既不完全符合传统 IaaS(对于零散、突发的使用场景而言过于昂贵和笨重)的模式,也打破了第一代 FaaS(函数即服务,因其无状态和较弱的隔离保证而无法满足需求)的设计假想。市场迫切需要一种新型运行时——它必须兼具虚拟机的状态化和隔离性与 Serverless 的经济性和弹性。这正是阿里云函数计算(Function Compute, FC)架构演进所要解决的核心问题。
|
6月前
|
存储 人工智能 安全
企业级 AI Agent 开发指南:基于函数计算 FC Sandbox 方案实现类 Chat Coding AI Agent
通过 Sandbox 与 Serverless 的深度融合,AI Agent 不再是“黑盒”实验,而是可被企业精准掌控的生产力工具。这种架构不仅适配当前 AI Agent 的动态交互特性,更为未来多模态 Agent、跨系统协作等复杂场景提供了可复用的技术底座。若您的企业正面临 AI Agent 规模化落地的挑战,不妨从 Sandbox 架构入手,结合函数计算 FC 的能力,快速验证并构建安全、高效、可扩展的 AI 应用系统。

相关产品

  • 容器计算服务
  • 容器服务Kubernetes版
  • 函数计算
  • 推荐镜像

    更多