官方博客-第13页-阿里云开发者社区

阿里云云原生

2024-11-01

977

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

977

阿里云云原生

2025-01-08

341

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

对于正在使用 GitLab 国际站托管代码的企业和研发团队，除迁移至极狐 GitLab 外，国内其他主流的 DevOps 平台也具有完备的产品能力，为开发者提供了更多的选择。其中，阿里云云效也提供了针对常见代码托管平台如 GitHub、GitLab 简单便捷的迁移方案，帮助用户快速完成核心代码数据的迁移，确保代码资产安全。

阿里云云原生

341

有松

2025-01-16

322

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

322

阿里云云原生

2025-04-28

713

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

713

吴昆

2024-05-15

222078

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,078

项良十眠

2024-05-15

1127

无忧微服务：如何实现大流量下新版本的发布自由

本文讨论了微服务上云过程中的稳定性挑战，特别是变更引起的生产故障。阿里云MSE（微服务引擎）提供了一种全链路无损发布方案，旨在消除变更风险，实现白天流量高峰时的安全发布。

项良十眠

1,127

隆基

2024-05-15

1480

RocketMQ 之 IoT 消息解析：物联网需要的消息技术

RocketMQ 5.0 是为应对物联网（IoT）场景而发布的云原生消息中间件，旨在解决 IoT 中大规模设备连接、数据处理和边缘计算的需求。

隆基

1,480

斜阳

2024-05-16

752

浅谈现代消息队列与云存储

讲述消息系统在现代化演进中软硬一体化，百万队列，分级存储等诸多竞争力特性的诞生和落地效果。探讨业界领先的 Shared-Log 存储计算分离，FFM与协程，RDMA 传输，列式存储等技术，将消息向流的领域延伸。

斜阳

752

龙蜥社区OpenAnolis

2024-07-05

708

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

ZOLOZ，视觉 AI 推理的算力和成本问题求解。

龙蜥社区OpenAnolis

708

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

AI 场景下，函数计算 GPU 实例模型存储最佳实践

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Kube Queue：Kubernetes 任务排队的利器

无忧微服务：如何实现大流量下新版本的发布自由

RocketMQ 之 IoT 消息解析：物联网需要的消息技术

浅谈现代消息队列与云存储

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

AI 场景下，函数计算 GPU 实例模型存储最佳实践

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Kube Queue：Kubernetes 任务排队的利器

无忧微服务：如何实现大流量下新版本的发布自由

RocketMQ 之 IoT 消息解析：物联网需要的消息技术

浅谈现代消息队列与云存储

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐