官方博客-第7页-阿里云开发者社区

米基

2024-05-15

4038

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,038

ModelScope

2024-05-15

15405

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,405

阿里云云原生

2024-11-04

1525

就3步，用通义灵码写一个数字华容道小游戏

Hey，小伙伴！你是不是总是下定了学习编程的决心，但又因为枯燥、困难打起了退堂鼓？今天让我们跟着通义灵码边玩边练，只需要简单的几句话，就可以打造一款经典的数字华容道小游戏，即使没有代码基础也能快速上手，也许在这个过程中，你不经意间就掌握了一些编程知识。让我们开始吧！

阿里云云原生

1,525

阿里云云原生

2025-02-25

1325

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,325

李德

2025-03-27

1355

大模型联网搜索的短板与突破之路

本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题，并提供了具体的案例和解决方案。

李德

1,355

阿里云大数据Al技术

2025-07-28

1742

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,742

ModelScope

2024-05-15

2840

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,840

殳玄

2025-01-16

1259

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,259

德灵

2024-05-15

118214

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,214

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

就3步，用通义灵码写一个数字华容道小游戏

解锁 DeepSeek 安全接入、稳定运行新路径

大模型联网搜索的短板与突破之路

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

现身说法，AI小白的大模型学习路径

阿里云PAI大模型RAG对话系统最佳实践

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

就3步，用通义灵码写一个数字华容道小游戏

解锁 DeepSeek 安全接入、稳定运行新路径

大模型联网搜索的短板与突破之路

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

现身说法，AI小白的大模型学习路径

阿里云PAI大模型RAG对话系统最佳实践