官方博客-第15页-阿里云开发者社区

木将

2024-09-11

448

二级缓存架构极致提升系统性能

本文详细阐述了如何通过二级缓存架构设计提升高并发下的系统性能。

木将

448

阿里云云原生

2024-11-01

982

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

982

信徒

2024-12-05

839

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

839

阿里云弹性计算

2025-01-06

171770

对话｜企业如何构建更完善的容器供应链安全防护体系

阿里云与企业共筑容器供应链安全

阿里云弹性计算

171,770

阿里云云原生

2025-04-07

690

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

690

阿里云云原生

2025-04-28

715

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

715

阿里云云原生

2025-04-29

686

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

686

达领

2023-04-23

25781

慢SQL是如何拖垮数据库的

本文结合一个实际故障案例出发，分析慢SQL是如何打垮数据库并引发故障的。

达领

25,781

德歌

2023-09-22

1735

沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑

本文所涉及的实验体验的就是怎么建设AI的外脑?向量数据库的核心价值:AI外脑

德歌

1,735

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

二级缓存架构极致提升系统性能

Serverless GPU：助力 AI 推理加速

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

对话｜企业如何构建更完善的容器供应链安全防护体系

极氪汽车云原生架构落地实践

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

慢SQL是如何拖垮数据库的

沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

二级缓存架构极致提升系统性能

Serverless GPU：助力 AI 推理加速

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

对话｜企业如何构建更完善的容器供应链安全防护体系

极氪汽车云原生架构落地实践

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

慢SQL是如何拖垮数据库的

沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑