官方博客-第2页-阿里云开发者社区

阿里云云原生

2024-05-15

2571

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,571

白玙

2025-03-14

1831

详解大模型应用可观测全链路

阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。

白玙

1,831

柳遵飞

2024-12-11

1024

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

1,024

悦达

2025-03-21

1226

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,226

刘佳旭

2023-09-26

139066

云原生场景下高可用架构的最佳实践

刘佳旭

139,066

任庆盛

2023-02-22

23245

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

23,245

乐忱

2024-06-14

39965

AI时代：云存储加速多模态数据存储与管理创新

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

39,965

子白

2024-05-15

102501

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,501

隆基

2024-05-15

142880

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

142,880

官方博客-第2页-阿里云开发者社区

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

详解大模型应用可观测全链路

SpringCloud 应用 Nacos 配置中心注解

监控vLLM等大模型推理性能

云原生场景下高可用架构的最佳实践

Flink CDC+Kafka 加速业务实时化

AI时代：云存储加速多模态数据存储与管理创新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

官方博客-第2页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

详解大模型应用可观测全链路

SpringCloud 应用 Nacos 配置中心注解

监控vLLM等大模型推理性能

云原生场景下高可用架构的最佳实践

Flink CDC+Kafka 加速业务实时化

AI时代：云存储加速多模态数据存储与管理创新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？