官方博客-第8页-阿里云开发者社区

米基

2024-05-15

3746

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,746

探索云世界

2025-08-05

780

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

780

阿里云大数据Al技术

2025-07-28

1408

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,408

牧申景穆

2024-09-02

3144

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,144

阿里云云原生

2025-08-18

447

基于 EventBridge 构筑 AI 领域高效数据集成方案

本文深入探讨了AI时代数据处理的变革与挑战，分析了事件驱动架构（EventBridge）在AI数据处理中的技术优势，并结合实践案例，展示了其在多源数据接入、向量数据库优化、智能数据转换等方面的应用价值。

阿里云云原生

447

宗衡

2025-07-10

686

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

686

阿里云云原生

2025-07-21

724

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

本课程通过通义灵码实现零代码数据分析全流程，涵盖数据读取、清洗、可视化、报告生成及内容仿写，无需编程基础，轻松掌握从CSV导入到PDF报告输出的实战技能。

阿里云云原生

724

坤硕

2024-07-29

20069

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,069

舟谨

2024-11-29

2018

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

2,018

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Qwen-MT：翻得快，译得巧

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

【算法精讲系列】阿里云百炼SFT微调实践分享

基于 EventBridge 构筑 AI 领域高效数据集成方案

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

作为开发者，我如何提高任务型大模型应用的响应性能

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Qwen-MT：翻得快，译得巧

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

【算法精讲系列】阿里云百炼SFT微调实践分享

基于 EventBridge 构筑 AI 领域高效数据集成方案

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

通义灵码保姆级教程：从数据读取、清洗、结合大模型分析、可视化、生成报告全链路

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

作为开发者，我如何提高任务型大模型应用的响应性能