官方博客-第9页-阿里云开发者社区

  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 2025-01-07
    368

    Envoy 开启 HTTP2 后偶现 404 解决方法

    在大部分基于 Envoy 实现的网关里,都存在这样一个问题,当开启 http2 时,客户端访问会出现偶发的 404,并且可以从日志注意到这些 404 的请求,:authority 头里的域名和 SNI 里的域名不一致。且在使用泛域名证书,且配置了多个域名的路由的情况下,这个问题特别容易出现。

  • 2025-01-20
    775

    1 行命令引发的Go应用崩溃

    这篇文章分析了Go编译时插桩工具导致go build -race竞态检测产生崩溃的原因。

    775
  • 2023-08-31
    641

    为什么 Higress 是 Knative 入口网关的最佳实践

    Knative Serving 是一款基于 K8s 的 Serverless 开源平台,用于构建和管理现代化、可拓展、流量驱动、无服务器的应用程序。本文重点关注 Knative 网络层能力的实现。

    641
  • 2023-09-19
    1151

    全网最细,深度解析 Istio Ambient Mesh 流量路径

    本文旨在对 Istio Ambient Mesh 的流量路径进行详细解读,力求尽可能清晰地呈现细节,以帮助读者完全理解 Istio Ambient Mesh 中最为关键的部分。

    1,151
  • 2024-05-15
    136190

    云原生场景下,AIGC 模型服务的工程挑战和应对

    本文介绍了在云原生场景下,AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

  • 2024-05-15
    79537

    深度剖析 RocketMQ 5.0,事件驱动:云时代的事件驱动有啥不同?

    本文技术理念的层面了解一下事件驱动的概念。RocketMQ 5.0 在面向云时代的事件驱动架构新推出的子产品 EventBridge,最后再结合几个具体的案例帮助大家了解云时代的事件驱动方案。

    79,537
  • 2024-05-15
    1188

    无忧微服务:如何实现大流量下新版本的发布自由

    本文讨论了微服务上云过程中的稳定性挑战,特别是变更引起的生产故障。阿里云MSE(微服务引擎)提供了一种全链路无损发布方案,旨在消除变更风险,实现白天流量高峰时的安全发布。

    1,188
  • 2024-05-15
    165312

    OpenKruise v1.6 版本解读:增强多域管理能力

    OpenKruise 在 2024.3 发布了最新的 v1.6 版本(ChangeLog),本文对新版本的核心特性做整体介绍。

  • 1
    ...
    8
    9
    10
    ...
    25
    到第
    9/25