官方博客-第2页-阿里云开发者社区

正己

2025-01-06

428

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

428

田双坤禹杨杨孙健翔

2024-05-15

101874

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,874

云服务器ECS

2024-05-15

490

百亿大规模图在广告场景的应用

这篇摘要主要介绍了美团外卖在搜索推荐业务中如何利用图技术解决挑战，包括外卖广告搜索推荐业务的介绍、异构大图的演进、大规模图引擎的建设，以及系统的总结和展望。

云服务器ECS

490

牧原

2025-02-21

666

K8S异常诊断之俺的内存呢

本文讲述作者如何解决客户集群中出现的OOM（Out of Memory）和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征，还深入探讨了排查过程中的关键步骤和技术细节。

牧原

666

元昌

2024-11-21

652

构建理想容器镜像——以CSI为例

本文围绕阿里云CSI（Container Storage Interface）镜像构建的实际案例，探讨了一系列优化容器镜像的最佳实践。

元昌

652

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

726

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

726

惜鸟

2024-11-15

1026

【提效】docker镜像构建优化-提速10倍

本文主要记录了自己通过查阅相关资料，一步步排查问题，最后通过优化Docerfile文件将docker镜像构建从十几分钟降低到1分钟左右，效率提高了10倍左右。

惜鸟

1,026

弃余

2023-08-11

1624

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,624

刘佳旭

2023-09-26

139131

云原生场景下高可用架构的最佳实践

刘佳旭

139,131

官方博客-第2页-阿里云开发者社区

类目筛选

内容类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

百亿大规模图在广告场景的应用

K8S异常诊断之俺的内存呢

构建理想容器镜像——以CSI为例

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

【提效】docker镜像构建优化-提速10倍

Linux 内存管理新特性：Memory folios 解读

云原生场景下高可用架构的最佳实践

官方博客-第2页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

百亿大规模图在广告场景的应用

K8S异常诊断之俺的内存呢

构建理想容器镜像——以CSI为例

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

【提效】docker镜像构建优化-提速10倍

Linux 内存管理新特性：Memory folios 解读

云原生场景下高可用架构的最佳实践