官方博客-第5页-阿里云开发者社区

章磊

2023-08-15

22905

迄今为止最完整的DDD实践

对于一个架构师来说，在软件开发中如何降低系统复杂度是一个永恒的挑战。

章磊

22,905

阿里云云原生

2024-05-15

2436

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,436

阿里云云原生

2024-05-15

63299

All in One：Prometheus 多实例数据统一管理最佳实践

当管理多个Prometheus实例时，阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案，两者在不同场景下各有优劣。

阿里云云原生

63,299

古琦

2024-07-04

109460

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

109,460

烨陌

2024-09-05

367

软件测试之道 -- 做一个有匠心的程序员

作者一年前围绕设计模式与代码重构写了一篇《代码整洁之道 -- 告别码农，做一个有思想的程序员！》的文章。本文作为续篇，从测试角度谈程序员对软件质量的追求。

烨陌

367

阿里云存储

2024-10-15

1232

AI时代数据湖实践

本文分享了如何利用阿里云的存储解决方案构建一个具备高效处理、高时效性的AI数据湖，通过高吞吐训练和高效推理帮助企业快速实现数据价值，以及用户在使用中的最佳实践。

阿里云存储

1,232

悦达

2025-03-21

1089

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,089

阿里云云原生

2025-04-29

627

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

627

非有

2024-05-15

1463

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,463

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

迄今为止最完整的DDD实践

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

All in One：Prometheus 多实例数据统一管理最佳实践

全链路追踪 & 性能监控，GO 应用可观测全面升级

软件测试之道 -- 做一个有匠心的程序员

AI时代数据湖实践

监控vLLM等大模型推理性能

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

一文详解 Java 限流接口实现

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

迄今为止最完整的DDD实践

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

All in One：Prometheus 多实例数据统一管理最佳实践

全链路追踪 & 性能监控，GO 应用可观测全面升级

软件测试之道 -- 做一个有匠心的程序员

AI时代数据湖实践

监控vLLM等大模型推理性能

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

一文详解 Java 限流接口实现