官方博客-第34页-阿里云开发者社区

  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 2024-12-26
    789

    网络安全视角:从地域到账号的阿里云日志审计实践

    日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。

    789
  • 2024-12-27
    936

    编译时插桩,Go应用监控的最佳选择

    本文讲解了阿里云编译器团队和可观测团队为了实现Go应用监控选择编译时插桩的原因,同时还介绍了其他的监控方案以及它们的优缺点。

    936
  • 2025-01-24
    1898

    DeepSeek-R1 来了,从 OpenAI 平滑迁移到 DeepSeek的方法

    Higress 作为一款开源的 AI 网关工具,可以提供基于灰度+观测的平滑迁移方案。

    1,898
  • 2025-01-26
    447

    基于 API 网关践行 API First 开发实践

    API First 开发模式的核心在于:以 API 为先,将其视为“头等公民”,在构建应用、服务及集成之前,应优先定义并设计 API 及其配套。API First 作为一种相对较新的开发模式,它已逐渐流行并获得业内的广泛认可。

    447
  • 2025-02-21
    597

    K8S异常诊断之俺的内存呢

    本文讲述作者如何解决客户集群中出现的OOM(Out of Memory)和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征,还深入探讨了排查过程中的关键步骤和技术细节。

    597
  • 2025-05-20
    352

    从 o11y 2.0 说起,大数据 Pipeline 的「多快好省」之道

    SLS 是阿里云可观测家族的核心产品之一,提供全托管的可观测数据服务。本文以 o11y 2.0 为引子,整理了可观测数据 Pipeline 的演进和一些思考。

  • 乐元素 X Hologres,一站式高性能游戏运营分析平台

    乐元素 X Hologres,一站式高性能游戏运营分析平台。

  • 2023-03-09
    11740

    数据湖存储的安全写入之道

    本文以 Hadoop 社区中的 S3A Connector 的实现为切入,分析了数据湖写入路径的安全性。

    11,740
  • 1
    ...
    33
    34
    35
    ...
    69
    到第