官方博客-第9页-阿里云开发者社区

灵杰开发者

2024-08-16

16595

RAG效果优化：高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

灵杰开发者

16,595

夏冬

2025-04-01

3617

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,617

ant-ray项目组

2025-04-11

1454

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,454

学仁

2025-05-29

2385

Dify是一款开源的大模型应用开发平台，支持通过可视化界面快速构建AI Agent和工作流。然而，Dify本身缺乏定时调度与监控报警功能，且执行记录过多可能影响性能。为解决这些问题，可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度，但仅支持公网部署、调度延时较大且配置复杂。相比之下，XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势，更适合大规模、高精度的调度需求。两者对比显示，XXL-JOB在功能性和易用性上更具竞争力。

学仁

2,385

ModelScope

2024-05-15

2847

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,847

悦达

2025-03-21

1414

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,414

影子刘宏宇刘军

2025-05-22

2536

Spring AI Alibaba 发布企业级 MCP 分布式部署方案

本文介绍了Spring AI Alibaba MCP的开发与应用，旨在解决企业级AI Agent在分布式环境下的部署和动态更新问题。通过集成Nacos，Spring AI Alibaba实现了流量负载均衡及节点变更动态感知等功能。开发者可方便地将企业内部业务系统发布为MCP服务或开发自己的AI Agent。文章详细描述了如何通过代理应用接入存量业务系统，以及全新MCP服务的开发流程，并提供了完整的配置示例和源码链接。未来，Spring AI Alibaba计划结合Nacos3的mcp-registry与mcp-router能力，进一步优化Agent开发体验。

影子刘宏宇刘军等

2,536

扬流

2024-05-15

119332

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,332

ModelScope

2024-05-15

1330

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,330

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

RAG效果优化：高质量文档解析详解

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

AI开源框架：让分布式系统调试不再"黑盒"

管理和调度Dify工作流

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

监控vLLM等大模型推理性能

Spring AI Alibaba 发布企业级 MCP 分布式部署方案

Paimon 与 Spark 的集成（二）：查询优化

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

RAG效果优化：高质量文档解析详解

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

AI开源框架：让分布式系统调试不再"黑盒"

管理和调度Dify工作流

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

监控vLLM等大模型推理性能

Spring AI Alibaba 发布企业级 MCP 分布式部署方案

Paimon 与 Spark 的集成（二）：查询优化

vLLM部署Yuan2.0：高吞吐、更便捷