官方博客-第7页-阿里云开发者社区

米基

2024-05-15

4033

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,033

殳玄

2025-01-16

1256

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,256

李德

2025-03-27

1348

大模型联网搜索的短板与突破之路

本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题，并提供了具体的案例和解决方案。

李德

1,348

宗衡

2025-07-10

947

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

947

ModelScope

2024-05-15

15398

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,398

刘军

2024-10-17

3283

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,283

学仁

2025-05-29

2362

Dify是一款开源的大模型应用开发平台，支持通过可视化界面快速构建AI Agent和工作流。然而，Dify本身缺乏定时调度与监控报警功能，且执行记录过多可能影响性能。为解决这些问题，可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度，但仅支持公网部署、调度延时较大且配置复杂。相比之下，XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势，更适合大规模、高精度的调度需求。两者对比显示，XXL-JOB在功能性和易用性上更具竞争力。

学仁

2,362

ModelScope

2024-05-15

2835

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,835

ModelScope

2024-05-15

1373

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,373

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

现身说法，AI小白的大模型学习路径

大模型联网搜索的短板与突破之路

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

阿里云开源 AI 应用开发框架：Spring AI Alibaba

管理和调度Dify工作流

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

元象大模型开源30款量化版本加速低成本部署丨附教程

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

现身说法，AI小白的大模型学习路径

大模型联网搜索的短板与突破之路

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

阿里云开源 AI 应用开发框架：Spring AI Alibaba

管理和调度Dify工作流

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

元象大模型开源30款量化版本 加速低成本部署丨附教程

元象大模型开源30款量化版本加速低成本部署丨附教程