官方博客-第7页-阿里云开发者社区

  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 2025-01-06
    282

    OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

    Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利,但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单,在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性,对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

    282
  • 101724

    阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

    阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

  • 2024-05-15
    76486

    总结|性能优化思路及常用工具及手段

    性能优化是降低成本的手段之一,每年大促前业务平台都会组织核心链路上的应用做性能优化,一方面提升系统性能,另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验,探讨一下性能优化的思路及常用工具及手段。

    76,486
  • 2024-07-29
    383

    从供应商深度绑定,到走向真正的云原生,他们是这样做的

    没有 K8s 的运维权限,开发者也能排查和定位问题。

  • 2024-09-03
    525

    React 的正确使用方法:ref 篇

    你真的用对了 useRef 吗?在与 TypeScript 一起使用、以及撰写组件库的情况下,你的写法能够避开以下所有场景的坑吗?

    525
  • 2025-01-23
    879

    快速定位并优化CPU 与 JVM 内存性能瓶颈

    本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。

    879
  • 2025-04-02
    461

    突破极限: 高负载场景下的单机300M多行正则日志采集不是梦

    在当今数字化时代,日志数据已成为企业 IT 运营和业务分析的关键资源。然而,随着业务规模的扩大和系统复杂度的提升,日志数据的体量呈现爆发式增长,给日志采集和处理系统带来了巨大挑战。

    461
  • 2024-05-15
    1379

    Koordinator v1.4 正式发布,为用户带来更多的计算负载类型和更灵活的资源管理机制

    Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制

    1,379
  • 1
    ...
    6
    7
    8
    ...
    15
    到第
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    7/15