[toc]
每个人似乎都在担心人工智能会如何夺走我们的工作。但令人惊讶的是,很少有人真正了解在实际环境中使用人工智能模型的基本方面。到目前为止,大多数技术人员都听说过 RAG - Retrieval Augmented Generation。简单来说,RAG 只是一种将文档或某些知识源链接到 AI 模型的方法。如果您正在考处理5 个文档,这听起来很容易。但是,如果让您考虑任何人或公司如何需要对数千、数万或数百万个文件执行此操作,则这是一个不同的问题。这是几乎所有公司都存在的问题。这就是为什么我大力倡导每个人至少对 RAG 是什么有基本的了解,因为它是使用 AI 模型所需的基本知识之一。
与生活中的任何事情一样,如果你认真对待它,这将是成为人工智能专家的起点。即使您对成为 AI 专家不感兴趣,了解 RAG 的所有部分的工作原理也肯定会为您提供良好的服务,因为许多公司将整合这些工作流程。
第一步:Parsing(解析), Text Chunking(文本分块), Indexing(索引)
这里,你需要了解什么怎么对文本进行分块,如何创建您的第一个库并开始执行基本步骤,库中的文档需要解析为统一的格式,并分成更小的文本(分块),然后使用所有元数据进行索引。
第二步:Build Embeddings(构建嵌入)
你需要了解什么是嵌入、嵌入模型、向量和向量数据库?学习嵌入、嵌入模型、向量和向量数据库背后的基本概念。
您需要使用 Hugging Face 中的模型构建您的第一个嵌入,以存储到数据库并使用这些嵌入来运行查询。
第三步:Prompt Models(提示词模型)
了解如何通过加载和提示来自 Hugging Face 和 OpenAI 的模型来提示模型。使用示例开始推理模型,并了解如何使用传递的上下文检查模型是否提供了正确的答案。了解如何捕获模型的使用情况数据,例如令牌使用、输出和总处理时间。
第四步:RAG with text query(通过检索增强查询文本)
我们需要在带有嵌入的库中获取某种形式的知识,并将这些碎片与模型组合在一起。了解如何将正确的 RAG 策略与深思熟虑的检索和查询策略结合使用正确的模型来完成工作。
第五步:RAG with Semantic Query(通过检索增强进行语义查询)
现在,您可以开始语义搜索了。也称为自然语言查询,这是我们获得嵌入和向量数据库的好处的地方。您将能够使用自然语言查询您的知识库,以提出问题,以便从最复杂的法律文件中获得答案。
第六步:RAG with Multi-Step, Hybrid Query(通过检索增强进行多步混合查询)
并学习如何在笔记本电脑上使用 Hugging Face 中的量化 DRAGON-YI-6b-GGUF 模型,执行多步骤混合查询以获得所需的响应。此外,了解如何执行证据验证(防止模型幻觉)以及如何将所有输出保存为 JSON 或 CSV 文件,以供将来的数据集或审核使用。