官方博客-第4页-阿里云开发者社区

  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 637

    如何有效降低产品级内存数据库快照尾延迟

    本文讲解内存键值对数据库在使用 fork 拍摄快照时引起的请求尾延迟激增问题如何解决的实践方案。

  • 2025-01-06
    281

    OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

    Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利,但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单,在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性,对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

    281
  • 304

    ACK AI Profiling:从黑箱到透明的问题剖析

    本文从一个通用的客户问题出发,描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查,最后到问题定位与解决、业务执行过程的分析,从而展现一个从黑箱到透明的精细化的剖析过程。

  • 2023-02-21
    1226

    如何在Anolis OS上轻松使用 Kata 安全容器

    本篇文章我们将详细介绍怎么轻松在 Anolis OS 上使用 Kata Containers 安全容器

    1,226
  • 2023-08-31
    1494

    便捷、快速、稳定、高性能,以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

    在多维度的优化加持下,Alibaba Cloud Linux 3 解决了 AI 开发人员的痛点问题,让 AI 开发体验更容易更高效。

    1,494
  • 101723

    阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

    阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

  • 2024-05-15
    165202

    OpenKruise v1.6 版本解读:增强多域管理能力

    OpenKruise 在 2024.3 发布了最新的 v1.6 版本(ChangeLog),本文对新版本的核心特性做整体介绍。

  • 2023-07-27
    2627

    部署MySQL数据库(Linux)

    MySQL是一个关系型数据库管理系统,常用于LAMP和LNMP等网站场景中。本教程介绍如何在Linux系统ECS实例上安装、配置以及远程访问MySQL数据库。

  • 1
    ...
    3
    4
    5
    ...
    9
    到第
    1
    2
    3
    4
    5
    6
    7
    8
    9
    4/9