官方博客-第7页-阿里云开发者社区

望宸

2025-02-20

864

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

864

学仁

2025-05-29

2368

Dify是一款开源的大模型应用开发平台，支持通过可视化界面快速构建AI Agent和工作流。然而，Dify本身缺乏定时调度与监控报警功能，且执行记录过多可能影响性能。为解决这些问题，可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度，但仅支持公网部署、调度延时较大且配置复杂。相比之下，XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势，更适合大规模、高精度的调度需求。两者对比显示，XXL-JOB在功能性和易用性上更具竞争力。

学仁

2,368

李德

2025-03-27

1353

大模型联网搜索的短板与突破之路

本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题，并提供了具体的案例和解决方案。

李德

1,353

夏冬

2025-04-01

3602

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,602

米基

2024-05-15

4034

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,034

殳玄

2025-01-16

1257

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,257

ModelScope

2024-05-15

1378

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,378

ModelScope

2024-05-15

2836

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,836

赵世振

2024-07-30

2099

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

2,099

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

管理和调度Dify工作流

大模型联网搜索的短板与突破之路

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型推理优化实践：KV cache复用与投机采样

现身说法，AI小白的大模型学习路径

元象大模型开源30款量化版本加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

阿里云百炼应用实践系列-AI助手快速搭建

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

管理和调度Dify工作流

大模型联网搜索的短板与突破之路

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型推理优化实践：KV cache复用与投机采样

现身说法，AI小白的大模型学习路径

元象大模型开源30款量化版本 加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

阿里云百炼应用实践系列-AI助手快速搭建

元象大模型开源30款量化版本加速低成本部署丨附教程