官方博客-第12页-阿里云开发者社区

阿里云云原生

700

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

本文探讨了AI应用在实际落地过程中面临的三大核心问题：如何高效使用AI模型、控制成本以及保障输出质量。文章详细分析了AI应用的典型架构，并提出通过全栈可观测体系实现从用户端到模型推理层的端到端监控与诊断。结合阿里云的实践经验，介绍了基于OpenTelemetry的Trace全链路追踪、关键性能指标（如TTFT、TPOT）采集、模型质量评估与MCP工具调用观测等技术手段，帮助企业在生产环境中实现AI应用的稳定、高效运行。同时，针对Dify等低代码平台的应用部署与优化提供了具体建议，助力企业构建可扩展、可观测的AI应用体系。

阿里云云原生

700

米基

2024-05-15

3860

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,860

探索云世界

2024-05-15

1627

一文理解淘宝购物车背后的逻辑

提升用户的使用体验才是产品升级的核心，本文将从业务发展以及技术沉淀两个方面来总结淘宝购物车的产品升级之路。

探索云世界

1,627

才胜南也

2024-09-05

1014

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

1,014

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43776

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,776

扬流

2024-05-15

119166

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,166

阿里云存储

2024-07-16

20504

几百T的视频、图片数据进行更有效地存储和管理

采用传统硬盘搭建存储方案，看起来成本低廉，但是再加上各种附加因素后却大幅攀升，而云存储厂商通常提供基于订阅的定价模型、一些免费服务和一定的折扣。现在，我们就来了解一下如何更省钱地使用云存储。

阿里云存储

20,504

阿里云实时数仓Hologres

2024-06-27

103038

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

103,038

阿里云实时计算Flink

2023-03-30

5005

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

5,005

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

大模型推理优化实践：KV cache复用与投机采样

一文理解淘宝购物车背后的逻辑

RAG效果优化：高质量文档解析详解

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

Paimon 与 Spark 的集成（二）：查询优化

几百T的视频、图片数据进行更有效地存储和管理

Hologres+Flink企业级实时数仓核心能力介绍

Apache Paimon 在同程旅行的探索实践

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

大模型推理优化实践：KV cache复用与投机采样

一文理解淘宝购物车背后的逻辑

RAG效果优化：高质量文档解析详解

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

Paimon 与 Spark 的集成（二）：查询优化

几百T的视频、图片数据进行更有效地存储和管理

Hologres+Flink企业级实时数仓核心能力介绍

Apache Paimon 在同程旅行的探索实践