官方博客-第12页-阿里云开发者社区

木将

2024-09-11

427

二级缓存架构极致提升系统性能

本文详细阐述了如何通过二级缓存架构设计提升高并发下的系统性能。

木将

427

信徒

2024-12-05

799

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

799

阿里云弹性计算

2025-01-06

171752

对话｜企业如何构建更完善的容器供应链安全防护体系

阿里云与企业共筑容器供应链安全

阿里云弹性计算

171,752

正己

2025-01-06

310

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

310

阿里云云原生

2025-04-28

687

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

687

阿里云基础设施.

2025-05-01

356

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

356

阿里云云原生

2025-05-28

466

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

PromQL AI 智能体上线。本文将从自然语言生成 PromQL 实践视角，探讨如何构建知识库、与大模型进行交互、最终生成符合需求的 PromQL 语句。本文还介绍了在 MCP 和云监控控制台下使用 AI 智能体的用例。

阿里云云原生

466

查斌

2023-04-14

575

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

575

元乙

2024-05-15

53278

面向全栈可观测的性能监控

SLS性能持续分析基于开放的接入生态与持续性能分析的理念所构建（开放接入部分已在iLogtail开源），基于SLS 性能持续分析，将为广大开发者提供开箱即用、一站式的的性能观测体验，助力开发者轻松面对多云、多Region、多版本、微服务等场景下的性能分析需求。

元乙

53,278

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

二级缓存架构极致提升系统性能

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

对话｜企业如何构建更完善的容器供应链安全防护体系

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

ACK AI Profiling：从黑箱到透明的问题剖析

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

面向全栈可观测的性能监控

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

二级缓存架构极致提升系统性能

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

对话｜企业如何构建更完善的容器供应链安全防护体系

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

ACK AI Profiling：从黑箱到透明的问题剖析

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

面向全栈可观测的性能监控