官方博客-第62页-阿里云开发者社区

  • 2024-05-15
    437

    大规模 Spring Cloud 微服务无损上下线探索与实践

    “从一次常见的发布说起,在云上某个系统应用发布时,重启阶段会导致较大数量的 OpenAPI、上游业务的请求响应时间明显增加甚至超时失败。随着业务的发展,用户数和调用数越来越多,该系统又一直保持一周发布二次的高效迭代频率,发布期间对业务的影响越来越无法接受,微服务下线的治理也就越来越紧迫。”

    437
  • 2024-05-15
    739

    【最佳实践】主机场景下如何使用ilogtail采集超大规模文件

    目标读者数字化系统开发运维(DevOps)工程师、稳定性工程师(SRE)、可观测平台运维人员等。使用场景客户的某些场景下,业务拆分的比较细,每个业务会定时输出一个日志文件(比如每小时输出一个文件),那么在一台机器上,可能会产生大量的日志文件。由于某些原因,用户不想在业务服务器上安装采集端,因此采用比...

  • 2024-05-15
    535

    通过HBR实现NAS容灾方案

    本文介绍如何基于NAS+云上备份HBR实现云文件数据容灾。

    535
  • Post-Training on PAI (3):PAI-ChatLearn,PAI 自研高性能强化学习框架

    人工智能平台 PAI 推出了高性能一体化强化学习框架 PAI-Chatlearn,从框架层面解决强化学习在计算性能和易用性方面的挑战。

  • LoongCollector:构建智能时代的数据采集新范式

    本文聚焦 LoongSuite 生态核心组件 LoongCollector,深度解析 LoongCollector 在智算服务中的技术突破,涵盖多租户观测隔离、GPU 集群性能追踪及事件驱动型数据管道设计,通过零侵入采集、智能预处理与自适应扩缩容机制,构建面向云原生 AI 场景的全栈可观测性基础设施,重新定义高并发、强异构环境下的可观测性能力边界。

  • 2024-05-15
    578

    基于业务的告警管理最佳实践

    本文主要介绍了SLS告警管理中心的业务概念和功能。

    578
  • 2024-05-15
    550

    通过 SLS 实现日志大数据入湖 OSS

    数据湖技术在日志生态中扮演不可或缺的角色,而打通日志从生产端到数据湖的链路却比较复杂。本文将介绍基于 SLS 方案为日志入湖提供端到端(End-to-End)支持,帮助用户提升接入效率,并在费用、运维上有效降低成本。

    550
  • 2024-05-15
    426

    618大促来袭,浅谈如何做好大促备战

    本文介绍了阿里云上关于大促备战的最佳实践。

    426
  • 2024-05-15
    502

    基于 OPLG 从 0 到 1 构建统一可观测平台实践

    “可观测”是近几年比较火的一个议题,而 OPLG 就是包含了 OpenTelemetry、Prometheus、Loki 和 Grafana 在内的开源可观测技术合集,它们之间将碰撞出什么样的火花?请阅读本文介绍的基于 OPLG 从 0 到 1 构建统一可观测平台实践。

    502
  • 1
    ...
    61
    62
    63
    64
    65
    到第