官方博客-第6页-阿里云开发者社区

  • 2024-08-26
    479

    十六年所思所感,聊聊这些年我所经历的 DevOps 系统

    从 2008 年开始,我陆陆续续参与了多个 DevOps 系统的建设,如今,审视这些系统的建设初衷和它们的设计思路或遇到的问题,依然有不少借鉴意义。我会按照时间顺序,把每个 DevOps 系统的特点,诞生的背景,以及在当时所主要解决的问题做一个概要的介绍,同时,我们也会以今天的视角再次审视这些问题,来看下同样的问题,经过十几年的发展,解决方案上有哪些不同。

    479
  • 2025-02-21
    596

    K8S异常诊断之俺的内存呢

    本文讲述作者如何解决客户集群中出现的OOM(Out of Memory)和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征,还深入探讨了排查过程中的关键步骤和技术细节。

    596
  • 2025-02-21
    815

    基于虚拟服务配置的渐进式迁移实践:Istio集群至ASM集群的平滑切换

    本文介绍了从Istio+k8s环境迁移到阿里云ASM+ACK环境的渐进式方法,通过配置虚拟服务和入口服务实现新老集群间的服务调用与流量转发,确保业务连续性与平滑迁移

    815
  • 2024-05-15
    1557

    从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

    本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论,深度解析企业云原生 DevSecOps 体系构建。

    1,557
  • 2024-05-15
    1425

    Koordinator v1.4 正式发布,为用户带来更多的计算负载类型和更灵活的资源管理机制

    Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制

    1,425
  • 2024-07-08
    46969

    私网环境下使用云效流水线进行 CI/CD的方法

    云效流水线可以托管用户的私网环境内的机器,并将构建任务调度到这些机器上,从而确保整个构建过程,和代码库和制品库的交互在私网环境下进行。

    46,969
  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 2025-01-20
    609

    ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明

    针对本地存储和 PVC 这两种容器存储使用方式,我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力,不仅对之前已有的监控大盘进行了优化,还针对不同的云存储类型,上线了全新的监控大盘,确保用户能够更好地理解和管理容器业务应用的存储资源。

    609
  • 2024-05-15
    107447

    容灾切换时间减少 99%,“云边协同”如何提升影演服务效率与稳定性

    容灾切换时间减少 99%,“云边协同”如何提升影演服务效率与稳定性

    107,447
  • 1
    ...
    5
    6
    7
    ...
    11
    到第
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    6/11