1.1 一个真实的需求
假设你手上有一本 170 页的小说《长安的荔枝》,你想快速了解:
• 主角是谁?
• 故事讲了什么?
• 荔枝最后是怎么送到长安的?
但你没时间读完整本书。这时候,你会怎么做?
人类的做法:
1.翻到目录,找到相关章节
2.快速浏览这些章节
3.找到关键信息
4.用自己的话总结答案
AI 能不能也这样做呢? 答案是:可以!这就是我们今天要探讨的技术。
1.2 从"搜索"到"理解"
传统搜索的局限
你可能会想:用 Ctrl+F 搜索关键词不就行了?
让我们试试:
搜索"主角" → 可能搜不到(书中可能用"李善德"而不是"主角")
搜索"李善德" → 找到 50 处,但哪句话说明他是主角?
问题:传统搜索只能做精确匹配,不能理解语义。
直接问 ChatGPT?
你可能又想:直接问 ChatGPT 不就行了?
问题:
• ChatGPT 没读过《长安的荔枝》
• 它可能会"编造"一个答案
• 无法引用原文,不可追溯
1.3 理想的解决方案
我们需要一个系统,它能:
1."读"过这本书 - 理解书中的内容
2.找到相关段落 - 像人一样快速定位
3.理解并回答 - 用自然语言给出答案
4.可以追溯 - 告诉你答案来自哪里
这就是 RAG(检索增强生成) 系统要做的事情。