官方博客-第9页-阿里云开发者社区

  • 2024-11-29
    486

    写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

    为了高效地发现、定位和解决预发问题,闲鱼团队研发了一套异常日志问题自动追踪-定位-分发机制。这套机制通过自动化手段,实现了异常日志的定时扫描、精准定位和自动分发,显著降低了开发和测试的成本,提高了问题解决的效率。

    486
  • OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

    聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

  • 2025-01-20
    609

    ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明

    针对本地存储和 PVC 这两种容器存储使用方式,我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力,不仅对之前已有的监控大盘进行了优化,还针对不同的云存储类型,上线了全新的监控大盘,确保用户能够更好地理解和管理容器业务应用的存储资源。

    609
  • 2023-08-07
    623

    MaxCompute ODPS 重装上阵,QUALIFY

    MaxCompute支持QUALIFY语法过滤Window函数的结果,使得查询语句更简洁易理解。Window函数和QUALIFY语法之间的关系可以类比聚合函数+GROUP BY语法和HAVING语法。

    623
  • 2023-12-01
    871

    MaxCompute 重装上阵,Global Zorder

    MaxCompute支持Global Zorder,使得整个表或者分区的数据在全局上能按照指定字段进行ZORDER排序,以便数据能有更好的聚集性。

    871
  • 109891

    基于 Hologres+Flink 的曹操出行实时数仓建设

    本文主要介绍曹操出行实时计算负责人林震,基于 Hologres+Flink 的曹操出行实时数仓建设的解决方案分享。

  • 2024-05-15
    107447

    容灾切换时间减少 99%,“云边协同”如何提升影演服务效率与稳定性

    容灾切换时间减少 99%,“云边协同”如何提升影演服务效率与稳定性

    107,447
  • 2024-05-15
    87788

    全新架构:日志服务 SLS 自研免登录方案发布

    全新架构!日志服务 SLS 自研免登录方案发布

    87,788
  • 2024-05-15
    1355

    AIGC训练场景下的存储特征研究

    在今天这样以AIGC为代表的AI时代下,了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告,来看看AIGC对于存储有哪些具体的性能要求。

  • 1
    ...
    8
    9
    10
    ...
    18
    到第
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    9/18