官方博客-第25页-阿里云开发者社区

  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 2024-12-27
    333

    OpenAI全球宕机思考:谈谈可观测采集稳定性建设

    文章探讨了为什么大规模集群中的可观测性服务会产生大量API请求、API服务器为何对DNS解析至关重要以及故障恢复过程为何缓慢的原因。

    333
  • 2025-01-26
    451

    基于 API 网关践行 API First 开发实践

    API First 开发模式的核心在于:以 API 为先,将其视为“头等公民”,在构建应用、服务及集成之前,应优先定义并设计 API 及其配套。API First 作为一种相对较新的开发模式,它已逐渐流行并获得业内的广泛认可。

    451
  • 2025-02-21
    822

    基于虚拟服务配置的渐进式迁移实践:Istio集群至ASM集群的平滑切换

    本文介绍了从Istio+k8s环境迁移到阿里云ASM+ACK环境的渐进式方法,通过配置虚拟服务和入口服务实现新老集群间的服务调用与流量转发,确保业务连续性与平滑迁移

    822
  • 2023-02-28
    16908

    应用场景系列之(1),流量管理下的熔断场景

    本文主要介绍深入理解熔断器在不同场景下的行为。

    16,908
  • 2023-10-12
    1327

    沉浸式学习PostgreSQL|PolarDB 19: 体验最流行的开源企业ERP软件 odoo

    本文主要教大家怎么用好数据库, 而不是怎么运维管理数据库、怎么开发数据库内核.

    1,327
  • 2023-11-01
    2456

    PolarDB-X V2.3 集中式和分布式一体化开源发布

    本文主要介绍PolarDB-X V2.3 集中式和分布式一体化开源。

  • 2024-05-15
    77459

    PolarDB-X Operator 基于两次心跳事务的指定时间点恢复方案介绍

    本文将介绍,PolarDB-X Operator将在事务策略为XA事务或者TSO事务时,如何实现全局一致的任意时间点恢复,提出了基于两次心跳事务的恢复方案。

    77,459
  • 2024-05-15
    133466

    走进RDS之MySQL内存分配与管理(上)

    MySQL的内存分配、使用、管理的模块较多,本篇文章主要介绍InnoDB层和SQL层内存分配管理器,主要包括ut_allocator、mem_heap_allocator和MEM_ROOT,代码版本主要基于8.0.25。

    133,466
  • 1
    ...
    24
    25
    26
    ...
    50
    到第