官方博客-第24页-阿里云开发者社区

阿里云云原生

2024-11-01

977

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

977

阿里云弹性计算

2025-01-06

171764

对话｜企业如何构建更完善的容器供应链安全防护体系

阿里云与企业共筑容器供应链安全

阿里云弹性计算

171,764

片风

2025-01-14

513

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

513

有松

2025-01-16

322

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

322

言澈

2025-02-28

1178

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,178

阿里云云原生

2025-04-28

713

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

713

资源编排ROS

2019-12-23

1860

资源编排ROS之自定制资源（多云部署AWS篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

1,860

查斌

2023-02-21

1280

如何在Anolis OS上轻松使用 Kata 安全容器

本篇文章我们将详细介绍怎么轻松在 Anolis OS 上使用 Kata Containers 安全容器

查斌

1,280

阿里云实时计算Flink

2023-03-30

4978

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,978

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

对话｜企业如何构建更完善的容器供应链安全防护体系

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

AI 场景下，函数计算 GPU 实例模型存储最佳实践

进行GPU算力管理

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

资源编排ROS之自定制资源（多云部署AWS篇）

如何在Anolis OS上轻松使用 Kata 安全容器

Apache Paimon 在同程旅行的探索实践

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

对话｜企业如何构建更完善的容器供应链安全防护体系

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

AI 场景下，函数计算 GPU 实例模型存储最佳实践

进行GPU算力管理

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

资源编排ROS之自定制资源（多云部署AWS篇）

如何在Anolis OS上轻松使用 Kata 安全容器

Apache Paimon 在同程旅行的探索实践