官方博客-第7页-阿里云开发者社区

牧申景穆

2024-09-02

3555

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,555

望宸

2025-02-20

874

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

874

学仁

2025-05-29

2378

Dify是一款开源的大模型应用开发平台，支持通过可视化界面快速构建AI Agent和工作流。然而，Dify本身缺乏定时调度与监控报警功能，且执行记录过多可能影响性能。为解决这些问题，可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度，但仅支持公网部署、调度延时较大且配置复杂。相比之下，XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势，更适合大规模、高精度的调度需求。两者对比显示，XXL-JOB在功能性和易用性上更具竞争力。

学仁

2,378

ModelScope

2024-05-15

15411

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,411

夏冬

2025-04-01

3612

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,612

米基

2024-05-15

4043

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,043

右予故黎

2024-11-21

1234

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,234

阿里云云原生

2025-04-25

2057

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

本文深入解析了Model Context Protocol（MCP）协议，探讨其在AI领域的应用与技术挑战。MCP作为AI协作的“USB-C接口”，通过标准化数据交互解决大模型潜力释放的关键瓶颈。文章详细分析了MCP的生命周期、传输方式（STDIO与SSE），并提出针对SSE协议不足的优化方案——MCP Proxy，实现从STDIO到SSE的无缝转换。同时，函数计算平台被推荐为MCP Server的理想运行时，因其具备自动弹性扩缩容、高安全性和按需计费等优势。最后，展望了MCP技术演进方向及对AI基础设施普及的推动作用，强调函数计算助力MCP大规模落地，加速行业创新。

阿里云云原生

2,057

刘军

2024-10-17

3300

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,300

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

大模型推理服务全景图

管理和调度Dify工作流

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型推理优化实践：KV cache复用与投机采样

“无”中生有：基于知识增强的RAG优化实践

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

阿里云开源 AI 应用开发框架：Spring AI Alibaba

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

大模型推理服务全景图

管理和调度Dify工作流

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

大模型推理优化实践：KV cache复用与投机采样

“无”中生有：基于知识增强的RAG优化实践

MCP Server 实践之旅第 1 站：MCP 协议解析与云上适配

阿里云开源 AI 应用开发框架：Spring AI Alibaba