官方博客-第17页-阿里云开发者社区

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

629

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

629

镭屿

2024-12-27

435

【硬核】C++11并发：内存模型和原子类型

本文从C++11并发编程中的关键概念——内存模型与原子类型入手，结合详尽的代码示例，抽丝剥茧地介绍了如何实现无锁化并发的性能优化。

镭屿

435

封崇

2025-04-16

1428

MCP 正当时：FunctionAI MCP 开发平台来了！

MCP 的价值是统一了 Agent 和 LLM 之间的标准化接口，有了 MCP Server 的托管以及开发态能力只是第一步，接下来重要的是做好 MCP 和 Agent 的集成，FunctionAI 即将上线 Agent 开发能力，敬请期待。

封崇

1,428

阿里云云原生

2025-04-28

715

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

715

阿里开发者

2023-05-16

8777

Spring循环依赖那些事儿（含Spring详细流程图）

本篇不仅仅是介绍Spring循环依赖的原理，而且给出Spring不能支持的循环依赖场景与案例，对其进行详细解析，同时给出解决建议与方案，以后出现此问题可以少走弯路。

阿里开发者

8,777

栾枝

2023-07-18

131019

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

131,019

屈岳

2023-12-01

62661

SLS支持高精度时间戳和全局排序

日志内容本身是一种重要信息，日志之间的相对顺序也是因果关系的一种反映，某些场景下如果日志内容完全相同，但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

屈岳

62,661

岱泽

2024-05-15

76571

总结｜性能优化思路及常用工具及手段

性能优化是降低成本的手段之一，每年大促前业务平台都会组织核心链路上的应用做性能优化，一方面提升系统性能，另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验，探讨一下性能优化的思路及常用工具及手段。

岱泽

76,571

元乙

2024-05-15

61730

面向全栈可观测的分布式链路追踪

全栈可观测App提供了一套完整的分析工具，从数据统计分析能力到数据关联，再到具备智能化和自动化特性的相关工具，以解决人们在可观测性方面所遇到的问题。未来，我们将持续提供更加丰富和强大的分析工具来满足用户的需求。

元乙

61,730

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

【硬核】C++11并发：内存模型和原子类型

MCP 正当时：FunctionAI MCP 开发平台来了！

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Spring循环依赖那些事儿（含Spring详细流程图）

手把手教你使用OSS-HDFS服务平替自建HDFS

SLS支持高精度时间戳和全局排序

总结｜性能优化思路及常用工具及手段

面向全栈可观测的分布式链路追踪

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

【硬核】C++11并发：内存模型和原子类型

MCP 正当时：FunctionAI MCP 开发平台来了！

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Spring循环依赖那些事儿（含Spring详细流程图）

手把手教你使用OSS-HDFS服务平替自建HDFS

SLS支持高精度时间戳和全局排序

总结｜性能优化思路及常用工具及手段

面向全栈可观测的分布式链路追踪