官方博客-第7页-阿里云开发者社区

牧申景穆

2024-09-02

3555

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,555

望宸

2025-02-20

874

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

874

学仁

2025-05-29

2378

Dify是一款开源的大模型应用开发平台，支持通过可视化界面快速构建AI Agent和工作流。然而，Dify本身缺乏定时调度与监控报警功能，且执行记录过多可能影响性能。为解决这些问题，可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度，但仅支持公网部署、调度延时较大且配置复杂。相比之下，XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势，更适合大规模、高精度的调度需求。两者对比显示，XXL-JOB在功能性和易用性上更具竞争力。

学仁

2,378

清都

2023-10-12

131955

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

本文以构建AIGC落地应用ChatBot和构建AI Agent为例，从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践，给大家快速落地AIGC应用提供参考。

清都

131,955

夏冬

2025-04-01

3612

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,612

ModelScope

2024-05-15

15409

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,409

右予故黎

2024-11-21

1234

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,234

米基

2024-05-15

4042

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,042

刘军

2024-10-17

3300

阿里云开源 AI 应用开发框架：Spring AI Alibaba

阿里云开源 Spring AI Alibaba，旨在帮助 Java 开发者快速构建 AI 应用，共同构建物理新世界。

刘军

3,300

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

大模型推理服务全景图

管理和调度Dify工作流

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

“无”中生有：基于知识增强的RAG优化实践

大模型推理优化实践：KV cache复用与投机采样

阿里云开源 AI 应用开发框架：Spring AI Alibaba

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

大模型推理服务全景图

管理和调度Dify工作流

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

“无”中生有：基于知识增强的RAG优化实践

大模型推理优化实践：KV cache复用与投机采样

阿里云开源 AI 应用开发框架：Spring AI Alibaba