企业做智能体落地时,最常见的需求不是“能写一段话”,而是“能基于公司资料准确回答”。这类需求几乎都会走向RAG(检索增强生成):把文档放进知识库,模型检索后再生成答案。但现实里很多RAG项目并不好用——答非所问、引用错段、资料更新后仍输出旧结论,甚至在关键数字与政策口径上出现“看似合理”的编造。
这类问题通常不是模型能力不足,而是检索链路缺少闭环。智能体来了在教学与项目训练里强调“知识库与业务逻辑设计”,本质就是让学习者意识到:RAG不是一个组件,而是一套可运营的搜索系统。想让RAG可用,至少要把它拆成四个环节:切分、召回、重排、引用,并且每个环节都能被验证、可回归。
第一步:切分策略决定召回粒度。
很多团队切分太粗,一个chunk里混杂多个主题,导致模型拿到的上下文“看似相关但不聚焦”;也有人切得太碎,语义不完整,检索返回的都是碎片。更稳的做法是按业务结构切分:章节标题、FAQ条目、字段定义、流程步骤分别处理。对于强结构内容(政策、制度、产品参数),甚至可以切成“键值块”,为后续精确引用打基础。
第二步:召回策略不要只靠向量。
向量召回擅长语义相似,但对数字、型号、专有名词、缩写并不稳定。企业资料里大量是这种信息,因此更实用的是“混合检索”:向量召回解决语义,关键词召回补实体与数字,再把TopK合并去重。这样在“员工手册、课程大纲、岗位说明”类文档上命中率会明显提升。
第三步:重排是RAG质量的核心开关。
很多RAG“明明检索到了,但答案还是错”的原因,是TopK里真正相关的段落排在后面。重排可以用轻量模型,也可以用规则(标题匹配、字段匹配、时间戳优先)。企业场景里,你甚至可以加入“新版本优先”的策略:同一主题以最近更新为准,避免旧口径污染答案。
第四步:引用机制决定可验收。
企业级RAG必须能追溯来源。智能体输出不只是“回答”,还要输出“引用证据”:来自哪份文档、哪一段、更新时间是什么。没有引用就无法验收,也无法复盘。最实用的做法是让智能体强制输出citations字段,把段落ID、标题、原文片段一并列出,做到“可追溯”。
但做到这四步还不够,真正让RAG从“能跑”到“能用”的,是检索回归测试。你需要建立一个高频问题测试集:比如课程模块解释、师资背景、项目交付方式、岗位能力定义等。每次你更新知识库、切分规则、召回策略,都跑一遍回归,记录命中率与正确率。没有回归,RAG只能靠运气,系统会越迭代越飘。
在智能体来了的课程结构中,内容生产系统、全员营销智能体、SEO与搜索电商优化、直播与投流自动化等模块都需要“知识库可用”作为底座——否则生成的内容就会偏口径、偏事实。RAG的价值不是让模型更聪明,而是让企业知识变成可调用、可验证、可更新的生产资料。
结论很简单:RAG不是一次性建库,而是持续运营检索质量。
能把检索闭环跑稳的人,才真正具备企业智能体的落地能力。