官方博客-第8页-阿里云开发者社区

阿里云云原生

632

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

本文探讨了AI应用在实际落地过程中面临的三大核心问题：如何高效使用AI模型、控制成本以及保障输出质量。文章详细分析了AI应用的典型架构，并提出通过全栈可观测体系实现从用户端到模型推理层的端到端监控与诊断。结合阿里云的实践经验，介绍了基于OpenTelemetry的Trace全链路追踪、关键性能指标（如TTFT、TPOT）采集、模型质量评估与MCP工具调用观测等技术手段，帮助企业在生产环境中实现AI应用的稳定、高效运行。同时，针对Dify等低代码平台的应用部署与优化提供了具体建议，助力企业构建可扩展、可观测的AI应用体系。

阿里云云原生

632

ModelScope

2025-06-16

522

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

522

阿里云大数据Al技术

2025-07-28

1422

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,422

探索云世界

2025-08-05

797

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

797

刘佳旭

2023-09-26

138982

云原生场景下高可用架构的最佳实践

刘佳旭

138,982

雨鸦

2024-12-27

1537

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,537

澄潭

2025-04-03

1822

开源 Remote MCP Server 一站式托管来啦！

MCP Server 的实施存在着诸多挑战，特别是在认证授权、服务可靠性和可观测性方面，Higress 作为 AI 原生的 API 网关，提供了完整的开源 MCP Server 托管解决方案，实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场，将大幅降低开发者构建 MCP Server 的时间和人力成本。

澄潭

1,822

阿里云云原生

2025-04-29

659

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

659

米基

2024-05-15

3761

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,761

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen-MT：翻得快，译得巧

云原生场景下高可用架构的最佳实践

极简开发，极速上线：构建端到端大模型应用

开源 Remote MCP Server 一站式托管来啦！

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

大模型推理优化实践：KV cache复用与投机采样

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen-MT：翻得快，译得巧

云原生场景下高可用架构的最佳实践

极简开发，极速上线：构建端到端大模型应用

开源 Remote MCP Server 一站式托管来啦！

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

大模型推理优化实践：KV cache复用与投机采样