方案测评|巧用文档智能和RAG构建大语言模型知识库-阿里云开发者社区

方案测评|巧用文档智能和RAG构建大语言模型知识库

2024-11-19 97

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

全局流量管理 GTM，标准版 1个月

NLP 自学习平台，3个模型定制额度 1个月

NLP自然语言处理_高级版，每接口累计50万次

简介： 本文介绍了一款基于文档智能和大语言模型（LLM）的文档解析及问答应用，旨在提升企业文档管理和信息检索效率。系统通过文档解析、知识库构建和问答服务三大模块，实现了从文档上传到智能问答的全流程自动化。

一、引言

在数字化转型的浪潮中，企业对于文档处理和信息检索的需求日益增长。传统的文档管理方式往往存在效率低下、信息检索困难等问题，无法满足现代企业对于快速响应和精准决策的需求。随着大语言模型（LLM）和文档智能技术的不断发展，这些挑战得到了新的解决方案。本文将测评一款基于文档智能的文档解析处理，并结合百炼平台构建的文档问答应用，旨在探索其在企业级文档类型知识库中的实际应用效果。

二、技术背景

1、大语言模型（LLM）

大语言模型（LLM）是自然语言处理（NLP）领域的一项核心技术，它通过深度学习技术，训练出能够理解、生成自然语言的大规模神经网络模型。LLM具备强大的语义理解和生成能力，能够处理复杂的语言结构和语境，为知识问答、内容生成等场景提供了强有力的支持。

2、文档智能

文档智能技术是指利用计算机视觉、自然语言处理等技术，对文档进行解析、提取、分类等处理，以实现文档信息的智能化管理。文档智能技术能够处理多种格式的文档，包括PDF、Word、Excel等，对于表格内容、公式文本、图片内容等复杂元素也能进行有效处理。

3、检索增强生成（RAG）

检索增强生成（RAG）是一种结合了信息检索和文本生成的模型，它能够在给定的上下文中，通过检索相关信息来生成更加准确、有逻辑的回复。RAG模型能够利用检索到的信息，为LLM提供丰富的上下文信息，从而提高问答的准确性和可信度。

三、方案架构

本次测评的系统架构主要包括如下：

文档解析：通过调用文档智能提供的文档解析（大模型版），将文件处理为Json对象，包含多个版面块单元。
构建知识库：文档内容切片向量化存储，将多个版面块过滤非正文内容，切分成多个切块，进行向量化服务，存入知识库中。
创建问答服务：当接收到一个提问时，服务首先将问题转换为内容向量，然后在知识库中进行召回，找到相关信息。接着，结合召回的内容和问题，通过语言模型进行智能问答，提供准确的回答。