官方博客-第18页-阿里云开发者社区

  • 2025-04-29
    700

    剑指大规模 AI 可观测,阿里云 Prometheus 2.0 应运而生

    本文介绍了阿里云Prometheus 2.0方案,针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集,采用全新时序存储引擎提升性能,并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力,结合PromQL与SPL语言增强分析功能。此外,该方案已成功应用于阿里云内部AI系统,如百炼、通义千问等大模型全链路监控。未来,阿里云将发布云监控2.0产品,进一步完善智能观测技术栈。

  • 400

    ACK AI Profiling:从黑箱到透明的问题剖析

    本文从一个通用的客户问题出发,描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查,最后到问题定位与解决、业务执行过程的分析,从而展现一个从黑箱到透明的精细化的剖析过程。

  • 2024-05-15
    96561

    PolarDB-X 开源 | 基于Paxos的MySQL三副本

    PolarDB-X 作为PolarDB分布式版,是阿里巴巴自主设计研发的高性能云原生分布式数据库产品,采用 Shared-nothing 与存储分离计算架构,支持集中式和分布式一体化形态,具备金融级数据高可用、分布式水平扩展、混合负载、低成本存储和极致弹性等能力,坚定以兼容MySQL开源生态构建分布式能力,为用户提供高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库服务。

  • 2024-05-15
    76589

    总结|性能优化思路及常用工具及手段

    性能优化是降低成本的手段之一,每年大促前业务平台都会组织核心链路上的应用做性能优化,一方面提升系统性能,另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验,探讨一下性能优化的思路及常用工具及手段。

    76,589
  • 2024-05-15
    1442

    Koordinator v1.4 正式发布,为用户带来更多的计算负载类型和更灵活的资源管理机制

    Koordinator v1.4 正式发布!为用户带来更多的计算负载类型和更灵活的资源管理机制

    1,442
  • 2024-02-18
    134785

    Higress × OpenKruiseGame 游戏网关最佳实践

    本文将演示 Higress 如何无缝对接 OKG 游戏服,并为其带来的优秀特性。

    134,785
  • 2024-05-15
    88964

    RocketMQ 流存储解析:面向流场景的关键特性与典型案例

    RocketMQ 流存储解析:面向流场景的关键特性与典型案例

    88,964
  • 2024-05-15
    189516

    Apache RocketMQ ACL 2.0 全新升级

    RocketMQ ACL 2.0 不管是在模型设计、可扩展性方面,还是安全性和性能方面都进行了全新的升级。旨在能够为用户提供精细化的访问控制,同时,简化权限的配置流程。欢迎大家尝试体验新版本,并应用在生产环境中。

    189,516
  • 2024-05-15
    536

    基于 OPLG 从 0 到 1 构建统一可观测平台实践

    “可观测”是近几年比较火的一个议题,而 OPLG 就是包含了 OpenTelemetry、Prometheus、Loki 和 Grafana 在内的开源可观测技术合集,它们之间将碰撞出什么样的火花?请阅读本文介绍的基于 OPLG 从 0 到 1 构建统一可观测平台实践。

    536
  • 1
    ...
    17
    18
    19
    ...
    58
    到第