人工智能|RAG 检索增强生成

简介: 1. 理解什么是 RAG 检索增强。2. 理解 RAG 检索增强应用场景。3. 了解 RAG 检索增强有哪些相关的使用方法。4. 在后续的学习过程中,会结合 LangChain 与 assistant 完成 RAG 相关的实战练习。

简介

现有的 ChatGPT 的大语言模型中,虽然它本身的功能已经非常强悍了,但是它依然存在一些致命的问题:

  1. 偏见:大语言模型没有分辨好坏的能力,所以在回答问题的时候,如果不做任何调整,可能会返回一些不好的内容,比如性别歧视,种族歧视。
  2. 幻觉:大语言模型有时候并不那么靠谱,返回的内容会让人觉得驴唇不对马嘴。包括信息也无法完全可信。
  3. 信息过时:因为没有联网能力,那么代表着从 2023 年 x 月 x 日之后所有的信息,它都是不了解的。

那么大模型 LLM 如何解决这些问题,使其生成的内容质量更高,就成了一个难题。

而 RAG(Retrieval-Augmented Generation),通过将检索模型和生成模型(LLM)结合在一起,即可提高了生成内容的相关性和质量。

RAG 的优点

  1. 外部知识的利用。
  2. 数据及时更新。
  3. 高度定制能力。
  4. 减少成本。

RAG 的应用场景

RAG 技术的主要应用场景为:

  1. 问答系统(QA Systems):RAG 可以用于构建强大的问答系统,能够回答用户提出的各种问题。它能够通过检索大规模文档集合来提供准确的答案,无需针对每个问题进行特定训练。
  2. 文档生成和自动摘要 (Document Generation and Automatic Summarization):RAG 可用于自动生成文章段落、文档或自动摘要,基于检索的知识来填充文本,使得生成的内容更具信息价值。
  3. 智能助手和虚拟代理(Intelligent Assistants and Virtual Agents):RAG 可以用于构建智能助手或虚拟代理,结合聊天记录回答用户的问题、提供信息和执行任务,无需进行特定任务微调。
  4. 信息检索(Information Retrieval):RAG 可以改进信息检索系统,使其更准确深刻。用户可以提出更具体的查询,不再局限于关键词匹配。
  5. 知识图谱填充(Knowledge Graph Population):RAG 可以用于填充知识图谱中的实体关系,通过检索文档来识别和添加新的知识点。

RAG 检索增强的原理

image.png

从上图可能很多同学非常好奇,大模型是如何与“外挂”数据库进行交互的。不是说大模型不能联网吗?其实大模型和数据库的交互,也是通过提示词完成的。

image.png

当然在以上实现过程中,可能会有数据信息极为庞大,而且冗余,如果直接发给大模型,上下文也会极为庞大。所以通常在这种情况下,会对数据库内的数据做一个预处理。让其变的易检索。这个预处理的过程,就使用了向量数据库以及embedding。

如下这张图便是 RAG 的完整过程:

image.png

RAG 实践应用

LangChain 包括 ChatGPT 的官方 assistant 的 Retrieval 其实都利用了 RAG 的原理。在后续的课程中会有更深入的实战应用。比如打造垂直领域内容的问答机器人。

相关资料

  • RAG 官方文档说明

总结

  1. 理解什么是 RAG 检索增强。
  2. 理解 RAG 检索增强应用场景。
  3. 了解 RAG 检索增强有哪些相关的使用方法。
  4. 在后续的学习过程中,会结合 LangChain 与 assistant 完成 RAG 相关的实战练习。
相关文章
|
8月前
|
存储 人工智能 自然语言处理
人工智能----RAG Workflow工作流详解
【11月更文挑战第20天】随着人工智能技术的飞速发展,自然语言处理(NLP)领域也迎来了革命性的变革。其中,检索增强生成(Retrieval-Augmented Generation,简称RAG)技术作为一种结合了信息检索与生成模型的技术,在提高生成式模型的准确性和实用性方面展现出了巨大潜力。本文将深入探讨RAG Workflow工作流的历史、背景、功能点、优缺点及其底层原理,并通过Java代码演示其主要功能点。
782 6
|
存储 人工智能 自然语言处理
【RAG】人工智能:检索增强(RAG)六步学习法
【5月更文挑战第1天】人工智能检索增强学习六步基本介绍
332 4
|
人工智能 自然语言处理 搜索推荐
人工智能,应该如何测试?(八)企业级智能客服测试大模型 RAG
大模型如GPT虽表现出众,但在特定领域和实时信息方面表现不足,易产生“幻觉”即编造答案。其能力受限于训练数据,无法提供超出数据范围的专业知识。为解决此问题,采用意图识别模型预判问题归属,结合检索增强生成(RAG)技术,通过检索相关信息注入大模型以提升回答质量。测试人员利用RAG评估模型效果,有时借助GPT进行自动化评分,尤其是在非专业领域,但GPT评分的准确性仍有限,人工评估更为可靠。
|
4月前
|
机器学习/深度学习 存储 人工智能
AI职场突围战:夸克应用+生成式人工智能认证,驱动“打工人”核心竞争力!
在AI浪潮推动下,生成式人工智能(GAI)成为职场必备工具。文中对比了夸克、豆包、DeepSeek和元宝四大AI应用,夸克以“超级入口”定位脱颖而出。同时,GAI认证为职场人士提供系统学习平台,与夸克结合助力职业发展。文章还探讨了职场人士如何通过加强学习、关注技术趋势及培养合规意识,在AI时代把握机遇。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能应用领域有哪些
本文全面探讨了人工智能(AI)的应用领域和技术核心,涵盖医疗、交通、金融、教育、制造、零售等多个行业,并分析了AI技术的局限性及规避策略。同时,介绍了生成式人工智能认证项目的意义与展望。尽管AI发展面临数据依赖和算法可解释性等问题,但通过优化策略和经验验证,可推动其健康发展。未来,AI将在更多领域发挥重要作用,助力社会进步。
|
6月前
|
机器学习/深度学习 人工智能 运维
人工智能在事件管理中的应用
人工智能在事件管理中的应用
194 21
|
7月前
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在现代医疗中的革新应用
本文深入探讨了人工智能(AI)技术在医疗领域的最新进展,重点分析了AI如何通过提高诊断准确性、个性化治疗方案的制定以及优化患者管理流程来革新现代医疗。文章还讨论了AI技术面临的挑战和未来发展趋势,为读者提供了一个全面了解AI在医疗领域应用的视角。
162 11
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在医疗诊断中的应用与前景####
本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状、面临的挑战及未来发展趋势。通过分析AI如何辅助医生进行疾病诊断,提高诊断效率和准确性,以及其在个性化医疗中的潜力,文章揭示了AI技术对医疗行业变革的推动作用。同时,也指出了数据隐私、算法偏见等伦理问题,并展望了AI与人类医生协同工作的前景。 ####
588 0
|
6月前
|
机器学习/深度学习 数据采集 人工智能
人工智能在变更管理中的应用:变革的智能化之路
人工智能在变更管理中的应用:变革的智能化之路
295 13

热门文章

最新文章