官方博客-第18页-阿里云开发者社区

有松

2025-01-16

322

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

322

言澈

2025-02-28

1178

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,178

阿里云云原生

2025-04-28

713

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

713

资源编排ROS

2019-12-23

1860

资源编排ROS之自定制资源（多云部署AWS篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

1,860

查斌

2023-02-21

1280

如何在Anolis OS上轻松使用 Kata 安全容器

本篇文章我们将详细介绍怎么轻松在 Anolis OS 上使用 Kata Containers 安全容器

查斌

1,280

阿里云云原生

2024-05-15

875

MSE Nacos，解决敏感配置的安全隐患

本文向大家介绍，MSE Nacos 是如何解决敏感配置的安全隐患，并提供使用 MSE Nacos 加解密敏感配置的最佳实践。

阿里云云原生

875

吴昆

2024-05-15

222078

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,078

云服务器ECS

2024-05-15

125148

倚天使用|YODA倚天应用迁移神器，让跨架构应用迁移变得简单高效

YODA(Yitian Optimal Development Assistant，倚天应用迁移工具)旨在帮助用户更加高效、便捷地实现跨平台、跨结构下的应用迁移，大幅度缩短客户在新平台上端到端性能验证所需的人力和时间，使得客户更加专注于应用本身算法的优化，协同客户实现降本增效。

云服务器ECS

125,148

项良十眠

2024-05-15

1127

无忧微服务：如何实现大流量下新版本的发布自由

本文讨论了微服务上云过程中的稳定性挑战，特别是变更引起的生产故障。阿里云MSE（微服务引擎）提供了一种全链路无损发布方案，旨在消除变更风险，实现白天流量高峰时的安全发布。

项良十眠

1,127

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

AI 场景下，函数计算 GPU 实例模型存储最佳实践

进行GPU算力管理

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

资源编排ROS之自定制资源（多云部署AWS篇）

如何在Anolis OS上轻松使用 Kata 安全容器

MSE Nacos，解决敏感配置的安全隐患

Kube Queue：Kubernetes 任务排队的利器

倚天使用|YODA倚天应用迁移神器，让跨架构应用迁移变得简单高效

无忧微服务：如何实现大流量下新版本的发布自由

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI 场景下，函数计算 GPU 实例模型存储最佳实践

进行GPU算力管理

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

资源编排ROS之自定制资源（多云部署AWS篇）

如何在Anolis OS上轻松使用 Kata 安全容器

MSE Nacos，解决敏感配置的安全隐患

Kube Queue：Kubernetes 任务排队的利器

倚天使用|YODA倚天应用迁移神器，让跨架构应用迁移变得简单高效

无忧微服务：如何实现大流量下新版本的发布自由