官方博客-第7页-阿里云开发者社区

米基

2024-05-15

3744

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,744

恭常

2024-09-04

2278

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,278

牧申景穆

2024-09-02

3144

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,144

阿里云云原生

2025-07-21

724

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

本课程通过通义灵码实现零代码数据分析全流程，涵盖数据读取、清洗、可视化、报告生成及内容仿写，无需编程基础，轻松掌握从CSV导入到PDF报告输出的实战技能。

阿里云云原生

724

阿里云大数据Al技术

2025-07-28

1406

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,406

舟谨

2024-11-29

2018

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

2,018

雨鸦

2024-12-27

1523

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,523

殳玄

2025-01-16

994

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

994

宗衡

2025-07-10

685

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

685

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【算法精讲系列】阿里云百炼SFT微调实践分享

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

作为开发者，我如何提高任务型大模型应用的响应性能

极简开发，极速上线：构建端到端大模型应用

现身说法，AI小白的大模型学习路径

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【算法精讲系列】阿里云百炼SFT微调实践分享

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

作为开发者，我如何提高任务型大模型应用的响应性能

极简开发，极速上线：构建端到端大模型应用

现身说法，AI小白的大模型学习路径

用 AI + 高德地图 MCP，3 小时做出杭州美食地图