OSS数据源一站式RAG最佳实践

简介: 本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

1. 背景

随着AIGC技术日新月异的发展,LLM应用也在持续迭代,检索增强生成(RAG)系统已经成为企业知识库、智能客服、电商导购等场景的核心环节。

对象存储OSS是一款海量、安全、低成本的云存储服务,支持众多类型数据的存储。众多企业、开发者选择将企业内部文档、知识存储到OSS中,作为云上的高可靠数据库。

与此同时,这些文档数据也是优质的素材来源,能够协助LLM基于企业内部数据,提升对话的安全性和准确性。因此,如何使用OSS中存储的企业数据,快速构建RAG系统,在企业知识库、智能客服等更好的服务员工、客户成为云上企业、开发者常见的问题。

2. 使用产品介绍

2.1 OpenSearch LLM智能问答版

OpenSearch LLM智能问答版内置数据解析与处理、切片、向量化、文本&向量检索、多模态LLM等模型和功能,提供一站式开箱即用的RAG产品,快速构建包含问答、对话、文档链接、参考图片在内的多模态对话式搜索服务,帮助企业和开发者快速搭建专属RAG系统。

除了可以直接通过控制台上传数据外,OpenSearch还支持OSS数据的快速导入,用户可以批量导入存储在OSS中的各种类型的文档,快速构建RAG知识库。

3. 配置流程概述

1、购买OpenSearch LLM智能问答版

image.png

2、导入存储在OSS中的文档(也可以通过控制台手动上传)

参考接口链接

image.png

其中cmd、content设置为URL,url为OSS中生成的文档链接或文档临时链接

3、在OpenSearch LLM智能问答版控制台进行问答参数配置和调试

(1)查看已导入的文档

image.png

(2)调整问答参数配置

image.png

4. 效果预览

image.png

image.png

OpenSearch LLM智能问答版支持pdf、doc、html、ppt等丰富形式的非结构化数据,和excel、json等结构化数据,还能支持对于图片等多模态内容的理解,可方便快捷的构建智能问答、对话式搜索系统。

至此,已完成了云上数据源的数据同步和RAG系统的搭建,将OpenSearch相应的接口接入到业务中,即可支持企业知识库、智能文档、电商导购、教育问答等多种多样的场景。


作者介绍
目录