官方博客-第11页-阿里云开发者社区

米基

2024-05-15

3860

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,860

阿里云大数据Al技术

2024-08-09

9163

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,163

李德

2024-12-06

1377

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,377

阿里云云原生

2025-05-16

684

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

684

阿里云云原生

2025-08-01

1059

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,059

阿里云云原生

699

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

本文探讨了AI应用在实际落地过程中面临的三大核心问题：如何高效使用AI模型、控制成本以及保障输出质量。文章详细分析了AI应用的典型架构，并提出通过全栈可观测体系实现从用户端到模型推理层的端到端监控与诊断。结合阿里云的实践经验，介绍了基于OpenTelemetry的Trace全链路追踪、关键性能指标（如TTFT、TPOT）采集、模型质量评估与MCP工具调用观测等技术手段，帮助企业在生产环境中实现AI应用的稳定、高效运行。同时，针对Dify等低代码平台的应用部署与优化提供了具体建议，助力企业构建可扩展、可观测的AI应用体系。

阿里云云原生

699

怀潜

2023-05-10

2896

Hologres+大模型初探，让ChatGPT回答商家问题

本文介绍基于Hologres+ChatGPT提供智能客服服务的实践。

怀潜

2,896

扬流

2024-05-15

119165

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,165

山泽

2024-05-15

1368

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,368

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

基于RAG搭建企业级知识库在线问答

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

Hologres+大模型初探，让ChatGPT回答商家问题

Paimon 与 Spark 的集成（二）：查询优化

从零构建现代深度学习框架(TinyDL-0.01)

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

基于RAG搭建企业级知识库在线问答

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

【深度】企业 AI 落地实践（四）：如何构建端到端的 AI 应用观测体系

Hologres+大模型初探，让ChatGPT回答商家问题

Paimon 与 Spark 的集成（二）：查询优化

从零构建现代深度学习框架(TinyDL-0.01)