灵杰开发者

2024-08-16

RAG效果优化：高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

灵杰开发者

11,307

牧申景穆

2024-09-02

137

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

137

千习

2024-07-22

14557

Spring Cloud Alibaba 集成分布式定时任务调度功能

Spring Cloud Alibaba 发布了 Scheduling 任务调度模块 [#3732]提供了一套开源、轻量级、高可用的定时任务解决方案，帮助您快速开发微服务体系下的分布式定时任务。

千习

14,557

王明橙鲤黄俊

2024-05-15

62002

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

62,002

德灵

2024-05-15

115405

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

115,405

计缘

2024-09-02

84

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算（FC）构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent，也支持基于Ollama部署的开源模型场景。

计缘

84

阿里云云原生

2024-09-02

94

基于 RocketMQ 的云原生 MQTT 消息引擎设计

本文将介绍阿里云如何将 Serverless 架构应用于消息队列，有效降低运营成本，同时利用云原生环境的特性，为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

阿里云云原生

94

米基

2024-05-15

949

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

949

阿里云云原生

2024-07-30

779

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

779

类目筛选

内容类型

RAG效果优化：高质量文档解析详解

【算法精讲系列】阿里云百炼SFT微调实践分享

Spring Cloud Alibaba 集成分布式定时任务调度功能

通义千问开源模型在PAI灵骏的最佳实践

阿里云PAI大模型RAG对话系统最佳实践

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

基于 RocketMQ 的云原生 MQTT 消息引擎设计

大模型推理优化实践：KV cache复用与投机采样

5 大场景上手通义灵码企业知识库问答