官方博客-第23页-阿里云开发者社区

  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 2024-12-26
    789

    网络安全视角:从地域到账号的阿里云日志审计实践

    日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。

    789
  • 2024-12-27
    936

    编译时插桩,Go应用监控的最佳选择

    本文讲解了阿里云编译器团队和可观测团队为了实现Go应用监控选择编译时插桩的原因,同时还介绍了其他的监控方案以及它们的优缺点。

    936
  • 2025-01-24
    1898

    DeepSeek-R1 来了,从 OpenAI 平滑迁移到 DeepSeek的方法

    Higress 作为一款开源的 AI 网关工具,可以提供基于灰度+观测的平滑迁移方案。

    1,898
  • 2025-01-26
    447

    基于 API 网关践行 API First 开发实践

    API First 开发模式的核心在于:以 API 为先,将其视为“头等公民”,在构建应用、服务及集成之前,应优先定义并设计 API 及其配套。API First 作为一种相对较新的开发模式,它已逐渐流行并获得业内的广泛认可。

    447
  • 2025-02-21
    597

    K8S异常诊断之俺的内存呢

    本文讲述作者如何解决客户集群中出现的OOM(Out of Memory)和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征,还深入探讨了排查过程中的关键步骤和技术细节。

    597
  • 2023-04-14
    583

    如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

    Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间,提升集群间的镜像分发效率。

    583
  • 2023-08-11
    1539

    Linux 内存管理新特性:Memory folios 解读

    本文主要讲解folio ,极其在应用中的直接价值。

    1,539
  • 2024-05-15
    1557

    从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

    本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论,深度解析企业云原生 DevSecOps 体系构建。

    1,557
  • 1
    ...
    22
    23
    24
    ...
    47
    到第