迈向可靠的垂类 Agent:检索增强、中场操作化与双线规则建构

简介: 本文提出“中场操作化”核心理念,破解垂类Agent可靠性瓶颈:将RAG降级为受约束数据库,首创双线规则建构(基础线保障学科共识、个性线承载实践经验),通过激活梯度蒙版实现知识到可执行规则的结构化转化,并以请求灌注机制践行认知诚实。全文聚焦工程可落地的架构创新。(239字)

迈向可靠的垂类 Agent:检索增强、中场操作化与双线规则建构

摘要:当前基于大语言模型的 AI Agent 面临一项结构性困境——检索增强生成(RAG)解决了"知识从哪来"的问题,却未解决"知识如何转化为可执行规则"的问题。检索层与生成层之间的"中场"——知识操作化层——是当前工程实践中最被低估的短板,亦是垂类 Agent 差异化竞争的核心战场。本文提出一套以中场操作化为中枢的 Agent 设计方法论,核心贡献包括:(1)将 RAG 重新定位为"受约束的数据库"而非"智能检索系统"——检索层容许过度召回,领域约束由生成层的连续激活梯度蒙版完成;(2)提出双线规则建构模型——基础线(学科共识、物质可验证)与个性线(个人经验编码、域内有效)——两条线通过同一蒙版机制协同运作;(3)在生成层之前嵌入规则操作化层,将检索到的原始知识转化为结构化的约束规则后方可参与推理;(4)建立请求灌注机制作为物理还原失败的系统出口。本文通过理论与架构推导,论证该框架如何在保持认知诚实的条件下,实现可审计、可追溯、可个性化的垂类 Agent 设计。

关键词:垂类 Agent;检索增强生成;中场操作化;双线规则建构;激活梯度蒙版;物理还原验证


1 引言

1.1 RAG 的成功与天花板

检索增强生成(Retrieval-Augmented Generation, RAG)[1] 是当前 AI Agent 工程实践中应用最广泛的技术范式。其核心逻辑简洁而有效:将用户查询转化为向量检索,从外部知识库中召回相关文档片段,将其注入 LLM 的上下文窗口,再基于增强后的上下文生成回答。这一范式成功解决了 LLM 的两项根本局限——知识截止日期与私有数据不可达,使 Agent 能够基于真实、可溯源的信息产出内容。

然而,RAG 的成功恰恰遮蔽了它的天花板。RAG 本质上是一个数据供给层:它能告诉模型"存在哪些相关信息",但无法告诉模型"如何运用这些信息做出可被信任的判断"。当一家金融机构的合规 Agent 检索到数百条相关监管条文时,RAG 完成了它的职责——但这离"Agent 做出了正确的合规判断"还有巨大的差距。这个差距不是检索精度的问题,是知识操作化的问题。

具体而言,RAG 范式面临三项结构性局限:

(1)检索无域界。向量检索是领域盲的——一个语义相似性查询会跨域召回结果。"风险"可能匹配到金融风险、医疗风险、环境风险,而检索层无从区分这些分属不同学科域的信息。现有解决方案(意图分类路由、知识图谱约束)本质上是在检索层做域过滤——要么硬分区损失召回,要么图结构约束仅覆盖实体关系而非学科边界。

(2)知识无法自动规则化。检索回来的信息是原始文本片段,不是结构化的推理规则。一条金融监管条文描述的是"什么情况适用该条款",但从文本到 Agent 实际执行的条件判断逻辑(if-then 规则),中间需要一次翻译。目前这个翻译完全依赖 LLM 的涌现能力——模型在上下文中"理解"了条文,然后"推理"——但这个过程不可审计、不可追溯、不可校准。

(3)行为规范缺失。RAG 增强了知识,但未增强行为约束。LLM 在训练过程中学到的最强行为准则是"生成符合人类偏好的输出"——而这个偏好被分布到全球众包标注者的均值上。对于垂类场景(法律、金融、医疗),均值偏好不仅不够,而且可能是错的。Agent 可以检索到正确的法条,但仍然可能因为"让回答听起来更全面"的行为习惯而引用不存在的判例——这不是知识缺失,是缺乏领域行为规范约束了模型的行为策略。

1.2 中场缺位:当前范式的结构性空洞

上述三项局限指向同一个结构性问题:检索层与生成层之间存在一个尚未被工程化的层次。我们称之为操作化层(Operationalization Layer),或更形象地——中场(Midfield)

层次 功能 当前工程成熟度
检索层(Retrieval) 从外部知识库召回相关信息 高——向量数据库、混合检索、GraphRAG 均有成熟方案
操作化层(Midfield) 将原始知识转化为可执行规则,设定行为边界,激活领域约束 极低——几乎无独立产品形态
生成层(Generation) 基于上下文生成输出 高——LLM 能力持续提升

当前主流的"RAG + LLM"架构在逻辑上是两步:检索 → 生成。本文主张这一架构在认知层面是三步:检索 → 操作化 → 生成。中场的存在不是可选的优化,而是可靠 Agent 的必要条件——因为 LLM 本身无法承担操作化的职责。LLM 可以"理解"知识,但无法"为自己设定领域行为边界"——这需要外部架构来定义。

1.3 本文的贡献

本文的核心主张是:垂类 Agent 的可靠性不取决于检索层的精度或生成层的能力,而取决于中场的操作化质量。基于这一主张,本文提出一套以中场为中枢的 Agent 设计框架,具体贡献包括:

(1)RAG 的重新定位:将 RAG 从"智能检索系统"降级为"受约束的数据库"——检索层容许过度召回以提高信号覆盖,领域约束由生成层的连续激活梯度蒙版承担。检索不怕污染,生成不乱用。

(2)双线规则建构模型:提出基础线(Foundation Line)与个性线(Individuality Line)的二分架构。基础线编码学科共识(跨从业者一致、物质可验证),个性线编码个人实践经验(域内有效、随从业者不同而异)。两条线通过同一蒙版机制协同运作。

(3)中场操作化层的工程设计:在检索与生成之间嵌入规则提取、优先级编排、蒙版激活和冲突裁决四个子模块,将原始知识转化为结构化约束后方可参与推理。

(4)请求灌注机制:当物理还原验证失败且系统内部无法解决时,触发向外的知识请求——系统承认认知边界而非强行输出。这是认知诚实在架构层的表达。

1.4 论文结构

第 2 节从 LLM 能力的本质出发,建立本文的认识论基础——论证 LLM 更接近于规则操作引擎而非概率猜测器,并在此基础上推导行为规范缺失是幻觉的根因。第 3 节构建中场操作化层的完整架构,包括双线规则建构、蒙版激活梯度模型和规则优先级编排。第 4 节在此基础上重新定位 RAG 的角色,定义检索层与生成层的协作边界。第 5 节设计验证体系与请求灌注机制。第 6 节以一个 B2B SaaS 客户健康度诊断场景为例,演示从双线规则建构到请求灌注的完整流程。第 7 节讨论该方法论的适用边界与局限。第 8 节总结全文。


2 认识论基础:LLM 能力的再审视

2.1 规则操作引擎 vs 概率猜测器

"LLM 是概率模型"这一技术事实常被转化为一种认知误导——暗示 LLM 的所有输出本质上都是"猜测",因此不可靠是固有属性,不可消除。本文认为这一论述混淆了训练机制能力本质

训练机制确实是概率性的:LLM 通过最大似然估计优化参数,目标是最大化训练数据中下一个 token 的条件概率。但这与"模型学到的能力本质是概率性的"是两回事。

考虑一个简单的实验。向 LLM 输入:"从 0 到 100 之间,选择一个数字。它是 9 和 11 的公约数。这个数字是多少?"在 temperature = 0 的条件下,模型输出"1"。现在改变数字:"它是 12 和 18 的公约数。"模型输出"2, 3, 6"(或仅"6"取决于具体 prompt)。这些输出不是从训练语料中"回忆"出来的——训练数据中极大概率不存在"9 和 11 的公约数是 1"的显式陈述。模型学会的不是具体的答案,而是执行"找公约数"这一算法的能力

这一观察与近年机制可解释性研究的发现一致:LLM 内部确实形成了可识别的"计算电路"——例如用于模运算的专用子网络 [2]、用于棋盘状态表示的自发世界模型 [3]。训练结束时,模型的权重不是存储了一个"答案表",而是组织成了一个隐式计算引擎——给定输入条件,执行操作,产出结果。

将 LLM 定性为"规则操作引擎"而非"概率猜测器"具有重要的认知后果:

(1)LLM 的输出不可靠不是因为它是概率的,而是因为它缺乏真实的条件输入和明确的操作边界。 概率性是训练机制,不是失败原因。真正的失败原因在于:信息输入可能是错的(未经检索验证),操作空间可能是乱的(缺乏领域蒙版约束),行为规范可能是偏的(经 RLHF 学来的通用偏好而非行业规范)。

(2)垂类 Agent 的工程目标不是"克服 LLM 的概率性",而是"为规则操作引擎提供真实条件、划定操作边界、注入行为规范"。 这从根本上重新定义了 Agent 设计的工程任务。

2.2 幻觉的行为归因:规范不足,非知识不足

基于上述认识论立场,本文对幻觉现象提出一种不同于主流解释的归因。

主流归因将幻觉定位为知识不足:模型缺乏相关信息,因此在信息真空中"编造"答案。这个归因预设了"补知识就能止幻觉"的工程路径——RAG 正是这一路径的产物。但这个路径面临一个无法解释的矛盾:配备了 RAG 的 Agent 仍然会产生幻觉。它可以检索到真实的法条后,仍然在论证中引用不存在的判例。

本文提出一个替代归因:幻觉的本质不是知识不足,而是行为规范不足。 具体地说:LLM 在训练过程中学到了一个隐式行为准则——"引用支持性地材料"是增强论证说服力的有效策略。这个策略在大多数通用场景中确实是有效的行为(学术写作、辩论、报告撰写均依赖引用)。但在专业场景中,这个策略需要被一个更强的约束覆盖:"引用必须可溯源且真实存在。"覆盖不是知识问题(模型不需要"知道更多"),而是行为优先级问题——"可溯源"这个约束必须被赋予高于"说服力"这个目标的优先级。

这一归因意味着:对抗幻觉,加 RAG 不够,必须加行为规范。 RAG 解决的是"让模型看到真实信息";行为规范解决的是"让模型在处理真实信息的过程中遵守领域的可靠标准"。

2.3 两条线:基础线与个性线

在行为规范的来源上,本文区分两个性质完全不同的层次。

基础线(Foundation Line):源于物质世界的客观约束和学科共同体的共识约定。基础线规则的特征是跨从业者一致——任何人面对同一客观约束,推导出的规则应该相同。典型的基础线规则包括:

  • 物理约束:橙色是视觉标记的最优色(人眼感光细胞对 589nm 波长最敏感,且与自然界常见背景色形成最大反差)
  • 数学约束:两点之间直线最短
  • 法律原则:公民权利平等、程序正义优先
  • 安全约束:任何涉及人身安全的决策必须同时满足冗余验证

基础线规则的特征是可物质还原——其有效性可以被独立于文化、行业、个人偏好的客观手段验证。基础线规则不是被 Agent "发现"的,而是被设计者承认并内置为不可覆盖的约束的。

个性线(Individuality Line):源于个人的实践经验和对特定领域的观察归纳。个性线规则的特征是域内有效、随从业者不同而异。典型示例:

  • 婚姻诉讼中,"同等条件下女孩判给女方的概率极高"——这不是法律条文,而是一个资深律师经手数百件案子后归纳的经验规则
  • B2B SaaS 客户成功管理中,"联系人完全失联 + WAU 下降超过 30% + 零工单 = 客户已事实停止使用"——这来自客户成功总监的实战观察,而非教科书

个性线规则的验证方式不是物质还原(因为它们的有效性本身就依赖特定司法管辖区、特定行业阶段、特定人群特征),而是效果反馈——该规则指导的判断在历史案例中的准确率。

基础线和个性线的区分不是学术分类,而是工程需要。两者在 Agent 架构中享有不同的置信度权重、不同的冲突裁决优先级和不同的可移植性约束。第 3 节将详细展开。


3 中场操作化层:架构设计

3.1 概览:三层架构中的中场

本文提出的 Agent 认知架构由三个功能层组成:

         ┌──────────────────────────────────┐
         │         检索层 (Retrieval)         │
         │  RAG 作为受约束的数据库              │
         │  容许过度召回 | 不负责域过滤          │
         └──────────────┬───────────────────┘
                        │ 原始知识 chunks
                        ▼
         ┌──────────────────────────────────┐
         │      操作化层 (Midfield)           │
         │  ┌─────────────────────────┐     │
         │  │  规则提取 (Rule Extraction) │    │
         │  ├─────────────────────────┤     │
         │  │  蒙版激活 (Mask Activation)  │    │
         │  ├─────────────────────────┤     │
         │  │  优先级编排 (Prioritization) │    │
         │  ├─────────────────────────┤     │
         │  │  冲突裁决 (Conflict Resolution)│   │
         │  └─────────────────────────┘     │
         └──────────────┬───────────────────┘
                        │ 结构化约束规则
                        ▼
         ┌──────────────────────────────────┐
         │         生成层 (Generation)         │
         │  蒙版约束下的规则推理                 │
         │  双路径生成 | 泄漏声明               │
         └──────────────────────────────────┘

检索层的职责是召回——尽可能多地返回与查询相关的原始信息。检索层不负责判断信息的学科属性、可信度或适用性。这一层追求高召回率,容许噪音进入——因为下游的中场会做过滤。

操作化层是本文的核心贡献。它承担四项功能:
(1)将检索到的原始知识转化为结构化规则(if-then 形式)
(2)根据当前任务激活对应的领域蒙版,划定认知边界
(3)编排激活规则之间的优先级顺序
(4)裁决规则冲突,产出可供生成层使用的约束规则集

生成层在蒙版约束下执行推理。蒙版不是嵌入在检索层(限制能搜到什么),而是部署在生成层(限制模型能调用什么)。这一设计的优势是:检索可以过度召回以保证信号覆盖,而生成严格受控以保证推理质量。信息不丢,只丢噪音。

3.2 双线规则建构

操作化层的规则库由两条线构成。

3.2.1 基础线建构

基础线规则来源于学科共同体的显式共识。建构基础线规则的过程是编码,而非学习——设计者(或领域专家)将本领域的核心约束以形式化规则的形式写入规则库。

基础线规则的形式定义:

F_i = (C_i, D_i, P_i, U_i)

其中:
  C_i:触发条件(condition),布尔表达式
  D_i:归属学科域(discipline domain)
  P_i:优先级(priority),不可覆盖 / 最高 / 高 / 中 / 低
  U_i:可覆盖性(overridability),布尔值

示例:

F_1 = (条件="决策涉及人身安全", 域=安全工程, 优先级=不可覆盖, 可覆盖性=否)
F_2 = (条件="法律推理中涉及基本权利", 域=宪法学, 优先级=不可覆盖, 可覆盖性=否)
F_3 = (条件="金融合规判断中涉及内幕交易嫌疑", 域=证券法, 优先级=最高, 可覆盖性=否)

基础线规则的"不可覆盖性"是该方法论的关键特征。它意味着:当一条基础线规则被触发时,任何与之冲突的个性线规则或检索到的外部信息都必须让步。这不是一个"建议",而是一个在系统中被强制执行的约束。

基础线规则的建构标准是跨从业者一致。如果两个独立的法律 Agent 设计者在各自的系统中编码"程序正义优先",产出的规则应该在功能上等价。基础线的验证方式不是"是否好用",而是"是否与该学科的教条一致"——一致性可通过同行审计完成。

3.2.2 个性线建构

个性线规则来源于个人的实践经验。建构个性线规则的过程是归纳——设计者(即从业者本人)将自己的实战观察转化为形式化规则,注入 Agent 的规则库。

个性线规则的形式定义:

I_j = (C_j, D_j, P_j, S_j, H_j)

其中:
  C_j:触发条件
  D_j:归属学科域(必须对应已有基础线域或新建子域)
  P_j:优先级(可在基础线优先级的任意非"不可覆盖"级别下自由设置)
  S_j:经验来源(source),描述该规则从哪些案例中归纳
  H_j:历史准确率(historical accuracy),该规则在历史案例中的命中率

示例:

I_1 = (条件="离婚诉讼 + 子女抚养权争议 + 子女为女孩 + 父母条件相当",
       域=婚姻法实务,
       优先级=高,
       来源="经手143件婚姻诉讼,其中涉及女孩抚养权的87件中79件判给女方",
       H=0.91)

I_2 = (条件="B2B SaaS + 联系人完全失联 + WAU下降>30% + 90天零工单 + 零NPS回应",
       域=客户成功管理,
       优先级=高,
       来源="过往6个季度中4个类似案例最终流失",
       H=0.67)

个性线规则的 H 字段(历史准确率) 是该设计的核心特征。它直接将规则的置信度与现实的反馈绑定——H = 0.91 意味着"这条规则在 91% 的历史案例中有效",H = 0.67 意味着"有效但不确定性较高"。H 随时间推移和案例积累动态更新,形成规则的自校准闭环。

个性线规则与基础线规则的关键区别在于可移植性。基础线规则可跨从业者移植——任何人的 Agent 都可以加载相同的"程序正义优先"规则。个性线规则不可移植——它的有效性绑定在特定从业者的经验体系和实践环境中。"女孩同等条件判给女方"可能在另一个司法管辖区或另一个法官群体中不成立。这种不可移植性不是缺陷,而是知识诚实:个性线规则的 H 字段本身就包含了"在特定的时空和人群范围内有效"这一隐含置信度折扣。

3.2.3 基础线规则的可发现性问题——一个反驳

一个自然的质疑是:基础线规则如何被"发现"?设计者如何知道哪些规则属于基础线?特别是对于新兴领域或跨学科领域,学界共识本身可能尚在形成中。

本文的回应是:基础线规则不是被"发现"的,而是被"承认"的。 对于任何一个已经形成学科共识的领域(法律、医学、工程、金融合规),基础线规则以教条(dogma)的形式存在——它们不是需要论证的结论,而是论证本身必须尊重的起点。"两点之间直线最短"不需要在每次空间路径规划中被重新论证——它被直接承认为约束条件。"公民权利平等"在法治推理中具有相同地位。

因此,基础线规则的建构工作不是"从零推导",而是从该学科的教材、法典、标准和伦理准则中提取约束条件,并将其形式化编码。这不是 AI 的工作——这是领域专家的设计工作。AI 可以提供辅助(检索学科文献、提示可能的约束),但判断"某条规则是否属于不可覆盖的基础线"这个动作本身,必须由人完成。

3.3 蒙版激活梯度模型

一旦规则库建构完成(双线均已编码),Agent 在执行具体任务时需要一个机制来决定"当前任务应该激活哪些规则"。这就是蒙版激活梯度模型。

设总学科域空间 D = {d₁, d₂, ..., dₙ}。对每个 Agent 实例 A 和每项任务 T,中场操作化层计算一个激活梯度向量:

$$m_T(d_i) \in [-1, 1]$$

其中 m = 1 表示该域处于最高激活状态,该域内的所有规则(基础线 + 个性线)均可参与推理;m = 0 表示静默状态,规则存在但不主动参与;m ∈ (0, 1) 表示半激活背景状态,规则可被动触发但每次调用需附加泄漏声明;m < 0 表示抑制状态,该域规则被显式阻断。

与生成层的蒙版梯度不同,中场的激活梯度有一个独特功能:它同时约束检索层的检索范围(软约束)和生成层的推理范围(硬约束)。具体而言,检索层以 m_T(d_i) 为权重调整检索策略(主激活域权重高、静默域权重低),但这只是优先级引导而非硬阻断——这是为了保留跨域信息的可用性。生成层则以 m_T(d_i) 为硬门控——只有 m_T(d_i) > θ_bg 的域内规则才能参与最终推理。

"多面体"模型:由于 LLM 的参数知识是分布式的,无法在物理上完美隔离学科域,蒙版的实际效果不是一个精确的球(完美隔离),而是一个多面体——主激活域被高度聚焦,背景域处于半激活的模糊状态,静默域被尽力抑制。与不受约束的大模型相比,多面体仍然是一个巨大的信噪比提升——因为即使隔离不完美,99% 的不相关学科知识处于"可被调用但不被主动调用"的状态,不会污染主推理路径。

3.4 规则优先级与冲突裁决

双线规则共存于同一激活域中时,冲突不可避免。操作化层需要一个显式的冲突裁决机制。

优先级排序遵循以下层级:

第 0 级(不可覆盖):基础线规则,U_i = false(不可覆盖)
第 1 级(最高):基础线规则,U_i = true + 基础线规则(可覆盖但优先级最高)
第 2 级(高):个性线规则(H > 0.85)+ 基础线规则(普通优先级)
第 3 级(中):个性线规则(0.6 < H ≤ 0.85)
第 4 级(低):个性线规则(H ≤ 0.6)+ 未经验证的经验判断

当同一域内两条规则同时被触发且指向相反结论时:

规则 1(同域冲突裁决):优先级高的胜出。同优先级时,基础线优先于个性线。两者属性相同时(同为基础线或同为个性线),触发置信度折扣——Agent 不选边,而是在输出中标注"存在冲突"并将双方论据一并呈现。

规则 2(跨域冲突裁决):当两个不同域的主激活规则产生冲突时——例如安全域要求"立即停机"而金融域要求"持续运行以保护资产"——冲突升级到第 0 级裁决。如果有任何一条规则属于第 0 级(不可覆盖),该规则无条件胜出。如果双方都在第 0 级以上但不在同一级,高优先级胜出。如果双方同为第 0 级且不可覆盖,触发请求灌注(见第 5 节)——因为这表示系统的地基本身出现了矛盾,不是内部裁决能解决的。

3.5 猜想:推理的中间产物作为合法知识输入

传统认识论将知识分为"事实"(已验证)和"猜想"(未验证),并倾向于后者在前者面前让步。本文认为,在 Agent 推理的实务中,这一二分法过于粗糙。

考虑以下情景:Agent 面对客户 J——WAU 降至 22%、联系人完全失联、零工单、零 NPS 回应。Agent 不能确定客户 J 已经流失(Q3 尚未结束,续约尚未到期),但 Agent 可以基于现有数据产出一个猜想——"客户 J 已在内部决定不续约,等待合同到期自然流失"。

这个猜想有三个特征:
(1)不是事实——尚未被物理还原验证
(2)不是没有根据——基于多个真实数据点的归纳推理
(3)具有认知价值——如果将这个猜想标记为猜想并输入后续推理,Agent 可以基于"假设客户 J 已放弃"这一前提,推演出"对客户 J 的常规 CS 跟进已无效,需启动非常规触达手段"这一可执行的行动建议

本文的框架将"猜想"接纳为推理链的合法中间产物——前提是被显式标记为猜想并附带其产生条件。猜想的置信度由其依赖的条件数量和质量决定:条件全部真实 + 规则历史命中率高 → 强猜想;条件部分真实 + 规则缺乏历史验证 → 弱猜想。强猜想可以在后续推理中作为近似事实使用(附带置信度折扣);弱猜想只能作为提示信号。

这一设计与第 5 节的请求灌注机制形成互补:物理还原能通过的 → 事实;物理还原不能通过但条件明确的 → 猜想,标记后继续推理;物理还原不能通过且条件也不明确的 → 触发请求灌注。


4 RAG 的重新定位

4.1 RAG 应该被降级

在中场操作化层的框架内,RAG 的角色需要被重新定义。

当前主流范式中,RAG 被寄予了过高的期望——它被视为"让 Agent 变聪明"的关键技术。然而,如第 1 节所述,RAG 的结构性局限决定了它的天花板:它是一个好的数据库,仅此而已。 它能增强模型的事实性,但不能增强模型的行为规范性;它能提供相关信息,但不能提供如何运用这些信息的约束规则。

因此,本文建议对 RAG 进行一次明确的降级:将 RAG 从"智能检索系统"重新定位为"受约束的数据库"。具体而言:

(1)检索层容许过度召回。 RAG 不需要在检索层做精准的域过滤、意图分类或路由策略。这些机制增加了检索层的复杂度,却仍然无法解决"语义相似 ≠ 学科相关"的根本问题。不如放弃在检索层解决域过滤,改由生成层的蒙版梯度承担。检索宁可多搜(高召回,容许噪音),生成严格不用(高精度,蒙版过滤)。

(2)检索结果不直接进入上下文。 检索回来的文档片段首先进入中场的规则提取模块——不是作为"要阅读的材料",而是作为"要提取规则的数据源"。提取出来的规则进入规则库后,与已有的基础线和个性线规则共同编排优先级,然后才参与推理。这意味着:

  • 检索到的虚假或误导性信息,如果在规则提取阶段无法被转化为与已有规则一致的约束,将被自动过滤
  • 检索到的跨域信息,如果在生成层的蒙版门控下不属于激活域,将在推理阶段被自然静默
  • 检索回来的信息不再是"要相信的东西",而是"要从中提炼规则的原料"

(3)RAG 解决的是知识供给,不是行为约束。 这是本文最核心的判断:幻觉的主要来源不是知识缺失(可以通过 RAG 补),而是行为规范不足(不能通过 RAG 补)。对抗幻觉,需要的是行为规范层——规则库中的基础线约束、蒙版梯度的域过滤、验证回路的物理还原——而不是更好的检索。

4.2 检索与生成的协作边界

基于上述定位,本文定义检索层与生成层的协作边界如下:

维度 检索层(RAG) 生成层(LLM + 蒙版)
职责 尽可能多地返回相关信息 仅在激活域内调用知识
质量标准 召回率(Recall) 精确率(Precision)
噪音处理 容许噪音进入 蒙版过滤噪音
失败模式 漏检(missed relevant info) 误用(used irrelevant info)
失败成本 低——漏检可被下游需求触发补充检索 高——误用直接污染推理链
域意识 无——向量检索语义驱动,非学科驱动 有——蒙版梯度定义学科激活边界

这一协作模型的核心洞察是:信息不丢,只丢噪音。 检索层的过度召回保证了信号的最大覆盖(不丢信息);生成层的蒙版过滤保证了只有激活域内的信号才能参与推理(只丢噪音)。这种分工将"检索精度"的压力从检索层移走,由生成层以更可信的方式(基于显式规则而非隐式向量相似度)来承担。

4.3 "RAG 搜索污染"问题及其解决

RAG 搜索污染(RAG Search Pollution)——即检索返回的跨域无关信息污染了推理链——是传统 RAG 范式中一个被低估的问题。当金融合规 Agent 检索"风险"时,返回的 chunks 可能混合了金融风险、医疗风险和环境风险。传统的解决策略(意图分类路由、知识图谱过滤)在检索层工作,效果受限于检索层本身的结构。

本文的框架提供了另一种解决路径:不做检索层的域过滤,在生成层做域门控。 检索回来的所有 chunks 进入中场的规则提取模块,提取出候选规则后,只有属于当前激活域(m_T(d_i) > θ_bg)的规则才会被送入生成层。跨域信息(如医疗风险相关的规则)在蒙版门控下被静默——不是因为它们被检索层拦截了,而是因为生成层的蒙版不允许它们被调用。

这一路径的优势在于:检索不丢信息(如果金融风险分析和医疗风险分析之间有真实的关联,医疗数据仍然可以被检索到),但生成不滥用信息(只有当前任务真正需要的域被激活)。这比检索层硬过滤更灵活,比无过滤更安全。


5 验证体系与请求灌注

5.1 物理还原验证的三层分级

本文继承并扩展了物质还原验证(Material Reduction Verification)的核心思想 [4]:将 Agent 的输出结论下沉到事实层,逐一验证其论据的物质基础。验证分为三个层次:

L1——形式验证(默认所有输出):检查输出格式合规性、结构化字段完整性、表面自相矛盾。通过则绿灯放行。

L2——采样物质还原(L1 不通过时触发):抽取支撑核心论点的论据(30-50%),逐一追溯其事实基础:

  • 论据声称的事实存在且准确 → verified
  • 论据声称的事实存在但有偏差 → 标记偏差度 δ(e)
  • 论据声称的事实不存在 → falsified → 触发 L3
  • 事实无法验证 → uncertain → 标记置信度折扣

L3——全量介入(L2 发现 falsified 时触发):全量论据还原 + 监督 Agent + 上游/下游 Agent 联合诊断。

5.2 对双线规则的特殊处理

基础线规则和个性线规则在验证体系中处于不同位置:

基础线规则不由 Agent 验证。 基础线规则的验证发生在设计阶段——由领域专家在设计文档中确认"该规则确实反映了学科共识"。Agent 在运行时将基础线规则视为公理——接受但不重新验证。这不是对基础线规则的迷信,而是对"Agent 不能在自己的推理中质疑自己的地基"这一认知原则的工程实现。

个性线规则由历史准确率(H 字段)持续校准。 每当该规则被触发并产出一个结论,该结论在后续的现实事件中要么被证实(提高 H)要么被证伪(降低 H)。H 的动态更新是规则库自改进的核心机制。当 H 降至 0.5 以下时,该规则自动降级为"待重新验证"状态,在推理中只作为提示信号而非判断依据。

5.3 请求灌注:物理还原失败的系统出口

在传统验证框架中,物理还原失败(falsified)触发的是回溯与修复——系统内部重新执行,试图修正错误。但有一类失败是系统内部无法修正的:当前体系的学科规则库中根本不存在所需的知识域。

本文提出请求灌注(Request Perfusion)机制来处理这类情况。其触发条件严格限定为:

(1)工作流拆解 Agent 分析任务后,识别出某个子任务需要特定学科域的知识;
(2)当前 Agent 实例的规则库中该域为空(既无基础线规则也无个性线规则);
(3)扩展现有蒙版(将相邻域的激活梯度扩展到该域)无法解决——因为不是激活不够,而是根本没有规则可激活;
(4)物理还原无法执行——因为缺乏判断所需事实是否成立的基线知识。

同时满足以上四个条件时,Agent 不是尝试硬推理,而是向外发出请求

[请求灌注 | 域=反垄断法 | 子任务=判断客户A的定价策略是否构成掠夺性定价
 | 原因=当前规则库中反垄断法域为空,无法进行物理还原验证
 | 请求内容=该域的基础规则集 + 至少一个经验规则]

请求灌注与第 3.5 节中"猜想"机制的区别在于:猜想是在条件明确但验证不可行时继续推理;请求灌注是在条件不明确且验证不可行时承认边界、向外求助。两者共同构成"认知诚实"在架构层的表达——系统知道什么时候可以继续、什么时候应该停下来。

请求灌注与传统的"人机协作"(Human-in-the-Loop)的区别在于:请求灌注是结构化的、可审计的、有明确触发条件的系统行为,而非模糊的"问一下人工"。请求包含了缺失域的具体名称、触发请求的任务上下文、以及需要注入的知识类型——这使得请求可以被高效处理(人可以直接给出规则,而非阅读整个推理链后猜测 AI 卡在哪)。


6 完整示例:婚姻家事 Agent 的全流程推演

为完整演示上述框架的运作,本节构造一个婚姻家事法律咨询场景。与前述 B2B SaaS 场景不同,本节的模拟数据为全新生成——涵盖三组完整的离婚案件当事人档案、法律事实清单和检索材料。Agent 的任务是:对所委托的三起案件进行诉前评估,识别各案的关键争议点、预判法院倾向并给出策略建议。

6.1 场景与模拟数据

案件背景:执业律师张律(以下简称"委托方")主营婚姻家事诉讼,现同时承接三起离婚案件。委托方已经完成当事人访谈和初步证据收集,但三起案件的复杂程度和事实清晰度差异极大。委托方将全部案卷材料提交给 Agent,要求进行统一的诉前评估。

以下是三起案件的完整模拟数据。


案件一:王某诉李某离婚纠纷

维度 数据
当事人 原告王某(女,34 岁,中学教师,月收入 ¥8,200);被告李某(男,37 岁,私企中层,月收入 ¥18,500)
婚龄 9 年
子女 一女(7 岁,小学二年级);一子(4 岁,幼儿园)
原告主张 被告长期酗酒,酒后多次对原告实施肢体暴力;2024 年 3 月酒后摔砸家具致女儿右前臂划伤缝针
子女抚养意愿 原告要求两个孩子的抚养权;被告在调解中表示"至少要儿子"
财产 婚后购置住宅一套(市价约 ¥280 万,尚有贷款 ¥85 万);被告名下轿车一辆(市价约 ¥18 万);双方存款合计约 ¥46 万
证据状况 A 级(内部一手):报警记录 3 次(2023.11、2024.01、2024.03);医院验伤报告 2 份;女儿伤情照片及病历;邻居证言 2 份;被告 2024.01 手写保证书一份(承认打人并承诺戒酒)。C 级(外部不可靠):被告同事圈传闻"李某工作压力大但为人不坏"——来源不明
争议焦点 抚养权归属(两个孩子的分配方案);家庭暴力认定对财产分割的影响;被告保证书的法律效力

案件二:赵某诉陈某离婚纠纷

维度 数据
当事人 原告赵某(男,42 岁,外企高管,年薪 ¥960,000);被告陈某(女,39 岁,婚后辞去工作照顾家庭至今 7 年,无收入)
婚龄 10 年
子女 一女(9 岁)
原告主张 感情破裂,妻子长期不顾家、未尽抚养义务;要求抚养权归自己
被告答辩 否认原告指控,称原告与女下属存在不正当关系(无直接证据);要求抚养权归自己,并要求高额离婚损害赔偿及经济帮助
财产 婚后住宅一套(市价约 ¥520 万,全款已付清);原告名下股票账户(现值约 ¥210 万);原告名下境外账户——新加坡某银行(金额不明,被告主张存在隐匿资产)
证据状况 A 级:房产证、股票账户流水(近 3 年)、原告近 3 年银行工资流水。B 级(人工录入有时滞):被告提交的原告酒店入住记录(3 次,与一女性同行人同住,由被告通过私人关系获取,合法性存疑)。缺失:境外账户信息(signal_quality: ABSENT
争议焦点 境外隐匿资产的查明与分割;被告 7 年全职照顾家庭是否构成离婚损害赔偿及经济帮助的法定事由;子女抚养权归属(一方高收入 vs 一方长期照顾子女);酒店记录可否作为"婚外情"证据使用

案件三:周某诉林某离婚纠纷

维度 数据
当事人 原告周某(女,28 岁,设计师,月收入 ¥12,000);被告林某(男,29 岁,自由职业,自称月收入"不稳定",约 ¥4,000-8,000)
婚龄 3 年
子女
原告主张 被告婚后长期无稳定工作,靠原告收入维持生活;多次向原告索要"创业资金"共计 ¥240,000(有转账记录),全部亏损;2024 年 9 月被告以自杀威胁原告不离婚
被告答辩 不同意离婚,称感情未破裂;创业亏损属正常商业风险
财产 婚后无房产(租房居住);原告名下存款 ¥62,000;被告名下无存款;原告名下剩余未到期的个人理财产品 ¥80,000(婚前购买,婚后收益 ¥9,600)
证据状况 A 级:转账记录(8 笔合计 ¥240,000);微信聊天记录(含被告自杀威胁言论,时间戳完整);双方银行流水。缺失:被告的实际收入——自称"不稳定"但无银行流水或税单佐证(signal_quality: ABSENT
争议焦点 婚前理财产品婚后收益 ¥9,600 的性质(个人财产还是夫妻共同财产);被告"创业资金" ¥240,000 的性质(借款、赠与还是共同投资);被告自杀威胁是否构成感情破裂的充分条件;原告是否需要向被告支付经济帮助

6.2 基础线规则建构

婚姻家事法学科域的基础线规则来自《中华人民共和国民法典》婚姻家庭编的明确的规范。以下为 Agent 规则库中已编码的核心基础线规则(从法典条文和司法解释中提取):

B-F01: {条件="离婚诉讼中存在家庭暴力 + 有报警记录或验伤报告"}
       → {判断="感情破裂的法定事由成立,应准予离婚"}
       [来源=民法典第1079条, 优先级=不可覆盖, 可覆盖性=否]

B-F02: {条件="子女抚养权争议 + 子女已满两周岁不满八周岁"}
       → {判断="按最有利于未成年子女原则判决"}
       [来源=民法典第1084条, 优先级=不可覆盖, 可覆盖性=否]

B-F03: {条件="子女抚养权争议 + 一方存在家庭暴力行为 + 施暴对象包含子女或子女目睹暴力"}
       → {判断="施暴方不宜获得子女抚养权,抚养权应优先判给非施暴方"}
       [来源=民法典第1084条 + 未成年人保护法 + 反家庭暴力法, 优先级=不可覆盖, 可覆盖性=否]

B-F04: {条件="离婚诉讼 + 一方隐藏/转移/变卖/毁损夫妻共同财产 + 或伪造夫妻共同债务"}
       → {判断="对该方可以少分或者不分"}
       [来源=民法典第1092条, 优先级=不可覆盖, 可覆盖性=否]

B-F05: {条件="离婚时 + 一方因抚育子女/照料老人/协助另一方工作等付出较多义务"}
       → {判断="有权向另一方请求补偿"}
       [来源=民法典第1088条, 优先级=最高, 可覆盖性=可被具体补偿计算覆盖}

B-F06: {条件="离婚诉讼 + 无过错方 + 对方存在重婚/与他人同居/家庭暴力/虐待遗弃/其他重大过错"}
       → {判断="无过错方有权请求损害赔偿"}
       [来源=民法典第1091条, 优先级=最高, 可覆盖性=可}

B-F07: {条件="证据取得方式违反法律禁止性规定或侵害他人合法权益"}
       → {判断="该证据应予排除,不得作为认定案件事实的根据"}
       [来源=民事诉讼法司法解释第106条, 优先级=最高, 可覆盖性=可}

B-F08: {条件="婚前财产在婚后产生的收益 + 该收益属于孳息或自然增值"}
       → {判断="该收益为个人财产,不纳入夫妻共同财产分割"}
       [来源=民法典婚姻家庭编司法解释一第26条, 优先级=最高, 可覆盖性=否}

B-F09: {条件="婚前财产在婚后产生的收益 + 该收益源于夫妻共同经营或管理行为"}
       → {判断="该收益为夫妻共同财产"}
       [来源=民法典婚姻家庭编司法解释一第26条, 优先级=最高, 可覆盖性=否}

注意 B-F03 的设计:它将"子女目睹暴力"纳入触发条件——这超出了单纯的法条文本,但反映了最有利于未成年子女原则在司法实践中的一贯适用。B-F07 的设计将非法证据排除规则编码为可自动执行的条件判断——当检索层返回了疑似非法获取的证据时,中场的规则提取模块会在规则冲突裁决阶段自动将其排除。


6.3 个性线规则建构

执业律师张律基于其 12 年婚姻家事诉讼经验,编码以下个性线规则:

I-F01: {条件="子女抚养权争议 + 子女为女孩 + 年龄 ≤ 10 岁 + 父母双方抚养条件相当"}
       → {判断="法院倾向于将女孩判给母亲"}
       [优先级=高, 来源="经手 87 件涉及女孩抚养权的案件,其中 71 件判给母亲", H=0.82, 
        最后更新=2025-11-15, 备注="该倾向在北京、上海、广州三地法院表现一致;在中西部部分地区未观察到显著差异"]

I-F02: {条件="子女抚养权争议 + 一方月收入 > 另一方月收入的 3 倍 + 但该方存在酗酒/暴力等负面行为"}
       → {判断="收入优势被负面行为严重削弱,法院不会仅因收入高而将抚养权判给该方"}
       [优先级=高, 来源="经手 12 件类似情况,11 件抚养权判给收入较低但无过错方", H=0.92,
        最后更新=2025-08-03]

I-F03: {条件="被告不同意离婚 + 原告无'感情破裂'的法定证据 + 婚龄 < 5 年 + 无子女"}
       → {判断="首次起诉可能判不离,需准备六个月后二次起诉"}
       [优先级=高, 来源="类似案件约 65% 首次判不离", H=0.65,
        最后更新=2024-12-09]

I-F04: {条件="一方以自杀相威胁 + 威胁言论被微信聊天记录固定 + 另一方坚决要求离婚"}
       → {判断="自杀威胁构成感情破裂的充分信号,法院倾向于判离;同时需在诉状中陈述该事实以加强说服力"}
       [优先级=高, 来源="经手 5 件类似情况,4 件首次判离,1 件因证据不足(无文字记录)判不离 → 本案有微信记录故参考 H=0.80",
        H=0.80, 最后更新=2025-06-20]

I-F05: {条件="一方主张隐匿境外资产 + 另一方否认 + 申请法院调查取证的预期效果不确定"}
       → {判断="境外资产查证的难度极高,策略上不应将诉讼重心押在不确定的境外资产分割上;
              建议将国内确定可分割的财产作为谈判基础,
              境外资产的线索作为调解施压工具"}
       [优先级=高, 来源="经手 4 件涉及境外隐匿资产的案件,仅 1 件成功查实并分割",
        H=0.25(查证成功率极低但策略价值高), 最后更新=2025-03-12]

这些个性线规则的设计体现了几个关键特征:

(1)非对称置信度:I-F05 的 H=0.25(查证成功率极低),但它仍然是有效的——因为它指导的不是"能不能查出来",而是"策略重心应该放在哪里"。H 字段在此承载的信息不限于准确率,还包括策略有效性。

(2)时间衰减可见:I-F03 的最后更新时间为 2024-12-09,距今已超过 12 个月。按照 §7.3 的 H 衰减机制,该规则应附加"时效性警告"——上海地区 2025 年的司法实践可能已发生变化。

(3)地理边界标注:I-F01 的备注显式标注了"该倾向在北京、上海、广州三地法院表现一致"——这意味着如果案件管辖法院不在这些地区,该规则的 H 值应附加地域折扣。


6.4 检索层的行为

Agent 收到委托方的完整案卷材料后,RAG 检索层以每个案件的核心要素为查询条件发起检索。以案件一(王某诉李某)为例,检索查询条件为:

"家庭暴力 + 子女抚养权 + 离婚损害赔偿 + 民法典第1079条 + 酗酒 + 保证书"

检索层从外部知识库(法律法规数据库、最高人民法院指导案例库、本地裁判文书库)返回以下结果:

# 检索结果 来源 可信度 学科域归属
1 民法典第1079条(感情破裂法定情形:家暴、遗弃、赌博恶习等) 法律法规库 A 婚姻法
2 民法典第1084条(子女抚养权判定原则) 法律法规库 A 婚姻法
3 民法典第1091条(离婚损害赔偿的法定情形) 法律法规库 A 婚姻法
4 反家庭暴力法第23条(人身安全保护令的申请条件) 法律法规库 A 婚姻法
5 最高法指导案例第XX号——家庭暴力认定不以造成伤害后果为要件,持续性威胁和控制即构成 指导案例库 A 婚姻法
6 某省高院 2024 年婚姻家事审判白皮书——家暴案件中 92% 的受害人获得抚养权优先考量 裁判文书库 B 婚姻法
7 一篇关于"原生家庭创伤对儿童心理发展的长期影响"的心理学综述 学术文献库 C 发展心理学
8 《刑法》第260条(虐待罪)——家暴行为可能同时触犯刑法 法律法规库 A 刑法
9 某保险公司"家庭暴力受害人专项救助保险"产品介绍 商业网站 C 保险业
10 一篇讨论"酗酒的神经生物学机制与戒断干预"的医学论文 学术文献库 C 神经医学

检索层不做域过滤——返回了跨婚姻法、刑法、心理学、保险业和神经医学五个域的 chunks。结果 #7(发展心理学论文)可能与子女抚养权的"最有利于未成年子女"论证相关;结果 #8(刑法虐待罪)可能增强家暴认定的法律威慑力;结果 #9(保险产品)和 #10(医学论文)则是明显的检索噪音——它们与"家暴"有语义相似性,但与当前案件的诉前评估无关。


6.5 中场的操作

6.5.1 规则提取

规则提取模块从检索返回的 chunks 中提取候选规则。以案件一为例:

  • 结果 #1-6(婚姻法域):提取为已编码的基础线规则的"激活确认"——检索结果确认了 B-F01 至 B-F06 在当前法律框架下仍然有效,且指导案例 (#5) 提供了对"家庭暴力认定"的司法解释级别的补充:家庭暴力的认定不以造成实际伤害后果为要件,持续性威胁和控制行为即构成。 这一补充被提取为对 B-F01 触发条件的扩展。
  • 结果 #7(发展心理学域):提取为一条弱信号——"家暴环境下成长的儿童面临显著的心理发展风险"。该信号未被编码为规则(当前规则库中发展心理学域为空),但可以作为 B-F03(施暴方不宜获得抚养权)的补充论证材料。
  • 结果 #8(刑法域):提取为一条跨域信号——"家暴行为可能同时触犯虐待罪"。属于刑法域,不属于婚姻法主激活域。
  • 结果 #9(保险业)和 #10(神经医学):提取失败——与案件争议焦点无关,被规则提取模块自动丢弃。神经医学关于"酗酒的生物学机制"虽在语义上与案件相关(被告酗酒),但其内容聚焦于治疗干预而非法律后果,不符合规则提取的"可操作性"标准。

6.5.2 蒙版激活与门控

操作化层根据委托方的任务需求("婚姻家事诉前评估")计算激活梯度:

激活域 = {
  婚姻法:        1.0   ← 主激活域
  民事诉讼程序法:  0.8   ← 背景域(诉讼策略需要程序法支持)
  刑法:          0.4   ← 背景域(家暴可能同时触犯刑法,但诉前评估以民事为主)
  发展心理学:     0.2   ← 静默域(B-F02的"最有利原则"可能需要心理学支撑,
                              但当前规则库中无法独立验证心理学论断)
  保险业:        0.0   ← 静默域
  神经医学:      0.0   ← 静默域
}

门控阈值 θ_bg = 0.3

通过门控的规则(m > 0.3):
  B-F01 ~ B-F06(婚姻法基础线)
  I-F01, I-F02, I-F03, I-F04, I-F05(婚姻法个性线)
  指导案例#XX的补充解释(婚姻法域,检索增强)
  民事诉讼法证据规则 ← 民事诉讼程序法域
  刑法第260条(虐待罪)← 刑法域(m=0.4,通过门控但属背景域,使用时附加泄漏声明)

被静默的规则(m ≤ 0.3):
  发展心理学论文的全部论断(m=0.2,不通过门控)
  保险产品信息(m=0.0)
  神经医学论文(m=0.0)

关键观察:刑法域以 m=0.4 处于背景域(半激活)。Agent 在分析家暴的法律后果时,可以将"虐待罪"的刑法威慑力作为调解策略的一部分引用——但必须附加泄漏声明:[蒙版泄漏 | agent=婚姻家事Agent | 域=刑法 | 强度=0.4]。发展心理学论文被静默——不是因为其内容错误,而是因为婚姻家事 Agent 不具备独立判断心理学研究质量的能力。如果后续分析中 B-F02 的"最有利于未成年子女原则"需要心理学支撑,Agent 应触发请求灌注而非擅自引用未经裁判的心理学论断。

6.5.3 优先级编排与冲突裁决

三起案件分别激活了不同的规则子集,并在部分规则之间产生冲突。以下是关键冲突及其裁决:

案件一(王某诉李某)——规则冲突

触发规则:
  B-F01(家暴 + 报警记录 → 感情破裂成立,应判离)      [不可覆盖]
  B-F03(家暴 + 施暴行为涉及子女 → 施暴方不宜获得抚养权)  [不可覆盖]
  B-F06(家暴 → 无过错方有权请求损害赔偿)              [最高]
  I-F02(高收入 + 酗酒暴力 → 收入优势被负面行为严重削弱)   [高, H=0.92]

冲突:被告李某月收入 ¥18,500 远高于原告王某 ¥8,200。
      传统观念中"经济条件好的一方更适合抚养子女"可能与 B-F03 冲突。
裁决:B-F03 [不可覆盖] >> 任何非基础线规则。
      经济条件优势在家暴事实面前被完全抵消。
      附加:I-F02 以 H=0.92 的高置信度独立确认了同一判断方向(双线协同验证)。

案件二(赵某诉陈某)——证据排除裁决

触发规则:
  B-F07(非法获取证据 → 应予排除)                     [最高]
  触发条件判断:被告陈某提交的酒店入住记录

裁决过程:
  Step 1: 判断证据取得方式是否违反法律禁止性规定。
          陈某通过"私人关系"获取赵某的酒店入住记录——
          该行为涉嫌侵犯赵某的隐私权(民法典第1032条),
          同时酒店作为信息处理者未经合法程序泄露住客信息,
          涉嫌违反《个人信息保护法》第13条。
  Step 2: B-F07 触发 → 酒店入住记录作为非法证据予以排除。
  Step 3: 不影响陈某主张的"婚外情"事实本身——
          排除的是"这份证据",而非"这个事实"。
          陈某可以通过合法途径(申请法院调取酒店记录)重新获取同类证据。
  Step 4: 标注:该证据排除后,陈某对"婚外情"的主张暂时处于"无直接证据支持"状态,
          置信度降为 CI=2/5。

案件三(周某诉林某)——I-F03 的时效性警告

触发规则:
  B-F01(感情破裂法定情形——但周某主张的自杀威胁不属于民法典第1079条明确列举的情形)
  I-F04(自杀威胁 + 微信记录固定 → 法院倾向于判离)     [高, H=0.80]
  I-F03(原告无"感情破裂"法定证据 + 婚龄<5年 + 无子女 → 首次可能判不离) [高, H=0.65]

冲突:I-F04 和 I-F03 给出了相反的方向。
      I-F04 认为自杀威胁构成感情破裂的充分信号。
      I-F03 认为缺乏法定证据时首次起诉有较高概率判不离。

裁决路径:
  Step 1: 比较优先级——两者同为[高],无法仅凭优先级裁决。
  Step 2: 比较 H 值——I-F04 (H=0.80) > I-F03 (H=0.65)。
  Step 3: I-F03 的最后更新时间为 2024-12-09,超过 12 个月,触发"时效性警告"——
          该规则在当前司法实践中可能已发生变化。
  Step 4: 综合判定——采纳 I-F04 的方向(自杀威胁可构成感情破裂信号),
          但附加 H=0.65 的时效性警告作为置信度折扣。
  Step 5: 输出附带"双规则冲突标注"——
          "本判断基于 I-F04(H=0.80)与 I-F03(H=0.65,已过时效)的冲突裁决。
          两规则指向相反方向,最终以较高 H 值且数据较新的 I-F04 为准。
          但 I-F03 代表的司法实践(首次起诉可能判不离)不能被完全排除,
          建议准备调解与诉讼双轨策略。"

6.5.4 蒙版门控的检索噪音过滤效果

回顾检索层返回的 10 条结果,经过中场的规则提取 + 蒙版门控 + 优先级编排后,实际参与推理的只有 7 条(#1-#6 和 #8)。被过滤的 3 条中,保险产品 (#9) 和神经医学论文 (#10) 在规则提取阶段即被判定不满足"可操作性"标准并丢弃;发展心理学论文 (#7) 通过了规则提取但被蒙版门控(m=0.2 < θ_bg=0.3)静默。过滤率 30%,且被过滤的全部是检索噪音——未丢失任何与案件判断实质相关的信号。

这验证了"检索过度召回 + 生成蒙版过滤"策略的有效性:检索层不需要精准(给出了 30% 的噪音),中场的操作化处理自动过滤了噪音。


6.6 猜想与请求灌注的触发

6.6.1 案件二中的境外资产猜想

案件二的核心不确定性在于被告陈某(全职照顾家庭 7 年)主张的"境外隐匿资产"。

当前可用的信息

  • 肯定信号:赵某是外企高管,年薪 ¥960K,客观上具备境外置产的条件;赵某在新加坡某银行开设了账户(已确认),金额不明
  • 否定信号:无直接证据证明赵某将夫妻共同财产转移至境外账户
  • 缺失信号:境外账户的交易流水——signal_quality: ABSENT

物理还原在此完全不可行——Agent 无法向新加坡银行发起调查。但条件集是明确的:境外账户存在(已确认) + 金额不明(ABSENT) + 赵某是家庭主要收入来源(高收入者隐匿资产的动机客观存在)。

框架的处理路径

条件集明确 + 但物理还原不可行
          ↓
不触发请求灌注(因为条件是明确的,只是境外的物证不可达)
          ↓
触发"猜想"机制:
  猜想 G1: "赵某可能将部分夫妻共同财产转移至新加坡账户" 
          [猜想等级=中强猜想 | 支持条件=3个(境外账户存在+高收入+隐匿动机客观存在)
           | 反对条件=0个 | CI=2/5 | 可验证性=当前不可验证]
          ↓
猜想 G1 作为推理输入:
  结合 B-F04(隐匿转移财产 → 少分或不分)→ 
  "如果 G1 被证实,赵某将面临财产少分或不分的法律后果"
          ↓
  结合 I-F05(境外查证成功率极低 → 策略重心不应押在境外资产上)→
  "建议:将国内确定可分割的 ¥730 万资产(房产+股票)作为谈判基础,
   境外账户线索作为调解施压工具——向赵某传递信号:
   '如果你不配合国内资产的公平分割,我们将申请对新加坡账户的司法协查',
   利用 F04 的威慑力促成国内资产的和解"

猜想在此发挥了关键作用:不做猜想 → Agent 只能说"境外资产情况不明,无法判断"(虽诚实但无用)。做猜想并标记为猜想 → Agent 可以说"当前无法确定,但基于已有线索的推演是 X,建议的策略是 Y,这些判断附带 Z 的置信度折扣"(既诚实又有用)。

6.6.2 案件一中的请求灌注触发

案件一的分析进行到子女抚养权的"最有利于未成年子女原则"论证时,Agent 面临以下问题:

B-F02 要求按"最有利于未成年子女原则"判决两个孩子的抚养权归属。但"最有利"的具体判断涉及以下子问题:

  • 7 岁女儿曾在 2024 年 3 月目睹父亲摔砸家具并因此受伤(缝针)——这一事件对女儿的心理影响程度如何?是否构成将女儿与儿子"分开抚养"(姐弟分离)的充分理由?
  • 两个子女(7 岁和 4 岁)是否需要"同一抚养环境"——即是否应将两子女的抚养权判给同一方?

这些问题超出了婚姻家事 Agent 的现有规则库范围。B-F02 给出了原则(最有利),但没有给出"怎么判断最有利"的操作规则。I-F01 给出了性别相关的经验规则(女孩倾向于判给母亲),但未覆盖"姐弟是否应该分开抚养"的问题。

触发请求灌注的条件检查

(1) 工作流分析识别出子任务需"儿童发展心理学"域的知识——
    → 如何评估家暴事件对 7 岁儿童的心理影响程度?姐弟分离对双方发展的影响?

(2) 当前规则库中"发展心理学"域为空 → 满足

(3) 扩展当前蒙版无法解决 → 发展心理学域 m=0.2(静默),
    即便将其提升至背景域(m=0.4),规则库中该域仍为空——
    不是激活不够,是根本没有规则可激活 → 满足

(4) 物理还原不可行 → 需要对"心理影响"做专业判断,
    但婚姻家事 Agent 不具备独立评估心理学研究的能力 → 满足

四条件全部满足 → 触发请求灌注

请求灌注的内容

[请求灌注 | 域=儿童发展心理学
 | 触发任务=案件一·子女抚养权评估
 | 具体问题=
   ① 7岁儿童目睹家暴并身体受伤后,典型心理影响的程度与持续时间(用于评估"是否必须与施暴父亲隔离")
   ② 姐弟(7岁+4岁)在不同抚养环境中分别成长的利弊比较(用于评估"是否必须判给同一方")
 | 当前系统状态=B-F02已触发(最有利原则),I-F01已触发(女孩倾向于母亲),
   但无法操作化"最有利"的具体判断标准
 | 请求内容=儿童发展心理学域的基础规则 ≥3条 + 如果存在相关经验研究,请附核心结论及置信度
 | 期望响应时间=案件评估截止前48小时(本案非紧急,但请求灌注的结果将直接影响策略建议的精确度)]

请求灌注的处置:系统将请求挂起,等待委托方(或委托方指定的心理学专家)注入规则。在等待期间,Agent 基于现有规则继续产出"不完整评估"——标注子女抚养权部分因请求灌注尚未完成而存在置信度折扣(CI=3/5 [待补],CV=4/5 [心理学判断目前不可由本系统独立验证]),但不阻塞案件的其余分析(感情破裂认定、财产分割、损害赔偿)的产出。


6.7 完整输出:三案评估报告的结构

经过上述全流程处理后,Agent 产出以下结构化输出:

案件一(王某诉李某)评估要点

维度 判断 触发规则 置信度
感情破裂 成立,应准予离婚 B-F01 [不可覆盖] CI=4/5, CR=5/5, CV=5/5
抚养权·女儿 倾向于判给王某 B-F03 [不可覆盖] + I-F01 [高, H=0.82] CI=4/5, CR=4/5, CV=3/5 [请求灌注待补]
抚养权·儿子 倾向于判给王某(基于两子女不应分离 + B-F03) B-F02 [不可覆盖] + B-F03 [不可覆盖] CI=4/5, CR=3/5 [请求灌注待补], CV=3/5
财产分割 王某可主张多分(家暴为法定过错) B-F06 [最高] + 民法典第1087条 CI=5/5, CR=5/5, CV=5/5
损害赔偿 王某有权请求(需在诉状中明确金额及计算依据) B-F06 [最高] CI=4/5, CR=5/5, CV=4/5
策略建议 ① 申请人身安全保护令;② 抚养权以"不分离"为原则主张两个孩子;③ 保证书+B-F01 → 家暴认定把握极大;④ 被告"至少要儿子"的表述在庭上可被用以论证"重男轻女、非最有利于子女"

案件二(赵某诉陈某)评估要点

维度 判断 触发规则 置信度
感情破裂 待定——陈某不同意离婚,赵某未提交法定证据 B-F01 未触发 CI=3/5, CR=4/5, CV=4/5
酒店记录的可采性 应作为非法证据申请排除 B-F07 [最高] CI=5/5, CR=5/5, CV=5/5
抚养权 倾向于判给陈某(7年全职照顾+子女<8岁+最有利原则) B-F02 [不可覆盖] + B-F05 [最高] CI=4/5, CR=5/5, CV=4/5
经济补偿 陈某有权请求(7年全职照顾属于B-F05的触发条件) B-F05 [最高] CI=4/5, CR=5/5, CV=4/5
境外资产 [猜想 G1] 赵某可能将财产转移至新加坡账户 I-F05 [高, H=0.25] CI=2/5, CR=3/5, CV=1/5 [不可独立验证]
策略建议 ① 以国内 ¥730 万确定资产为谈判基础;② 境外资产线索作为调解施压工具;③ 如赵某坚持离婚,可通过合法途径申请法院向新加坡银行调取账户信息(司法协查路径);④ 本案建议走调解优先路线

案件三(周某诉林某)评估要点

维度 判断 触发规则 置信度
感情破裂 倾向于认定成立(自杀威胁被微信记录固定) I-F04 [高, H=0.80] vs I-F03 [高, H=0.65, 时效性警告] → 采纳 I-F04 方向 CI=4/5, CR=3/5, CV=4/5
婚前理财婚后收益 ¥9,600 的性质取决于是否由"夫妻共同经营行为"产生 → 本案系个人理财产品自动收益,倾向于认定为个人财产 B-F08 [不可覆盖] vs B-F09 [最高] → B-F08 触发(自动收益=孳息,非共同经营) CI=5/5, CR=5/5, CV=5/5
创业资金 ¥240,000 性质有争议——转账记录不能直接证明是借款/赠与/共同投资。需要进一步调查被告使用该资金的具体方式和双方对资金性质的约定(如有) 无直接触发规则 CI=2/5, CR=3/5, CV=4/5
经济帮助 原告无需支付——原告月收入 ¥12,000 不构成"能够帮助"的条件,且被告有劳动能力 B-F05 不触发(原告非"付出较多义务"方) CI=4/5, CR=5/5, CV=5/5
策略建议 ① 微信记录+I-F04 → 感情破裂主张把握较大;② ¥240K 性质是最大不确定性——需补充调查;③ 理财收益¥9,600建议放弃争议(金额小+法律依据不充分);④ 无需担心被反诉经济帮助

6.8 与无中场框架的对比

为凸显中场的增量价值,将同一份模拟数据输入一个无中场框架(直接 RAG + LLM),观察其输出的差异:

维度 无中场框架(RAG + LLM) 有中场框架(本文框架)
案件一·抚养权判断 可能基于"母亲通常获得年幼子女抚养权"的通用认知给出结论,无法区分"I-F01 (H=0.82) 是经验规则"和"B-F03 是不可覆盖的强制规则"之间的优先级差异 B-F03 [不可覆盖] 强制锁定"施暴方不宜获得抚养权",I-F01 作为协同验证
案件一·请求灌注 不会触发——因为模型可以在无心理学知识的情况下自行生成"家暴对儿童的伤害是长期的"等看似合理的表述(这些表述可能是对的,但模型无法提供其判断的学科基础) 显式触发请求灌注,标注 CI/CR/CV 的缺口,不自行编造心理学判断
案件二·酒店记录 可能接受酒店记录作为有效证据并用于论证"婚外情存在",不自动执行非法证据排除规则 B-F07 自动触发排除,同时告知委托方如何通过合法途径(法院调取)重新获取同类证据
案件二·境外资产 可能直接断言"境外资产无法查明"或"建议申请法院调查"——两个方向都是合理猜测,但没有规则依据 I-F05 (H=0.25) 提供了结构化的策略判断——"查证成功率极低→策略重心不应押在此处→转化为施压工具"
案件三·理财收益 可能对 ¥9,600 的性质做出判断,但不同运行可能给出不同结论(模型随机性),无法追溯判断依据 B-F08 vs B-F09 冲突裁决 → "自动收益=孳息" → 明确的法律依据 + 可重现的判断
发展心理学论文 很可能被检索到并用于论证抚养权——因为它在语义上与"子女利益"高度相关,但模型不具有区分"心理学综述≠法律判决依据"的能力 蒙版门控(m=0.2 < θ_bg=0.3)静默——婚姻家事 Agent 不独立引用非法律域的学术文献
检索噪音 保险产品信息可能被 LLM 在上下文中的语义联想带入论证("如果你担心家暴风险,可以建议当事人购买...保险") 在规则提取阶段即被判定不满足"可操作性"标准并丢弃——婚姻家事诉前评估的核心关切是法律结果,不是保险推荐

这组对比的核心差异不是"谁更准确"(在简单案件中两者可能给出相同的结论),而是:

(1)可审计性:中场框架的每个判断都能追溯到具体的规则 ID、H 值和冲突裁决路径。无中场框架的判断来自 LLM 在黑盒中的涌现推理。

(2)可重现性:对同一案件,中场框架的结论是确定的(规则优先级 + 蒙版梯度 → 确定的判断路径)。无中场框架的结论可能在不同运行之间波动(模型随机性)。

(3)认知诚实:当系统不具备某域知识时(如发展心理学),中场框架触发请求灌注——"我目前不能判断这部分"。无中场框架可能生成听起来合理但缺乏学科基础的判断——"我可以判断这部分,但我的判断没有学科依据(你不知道)"。

(4)噪音免疫:30% 的检索噪音被中场的规则提取 + 蒙版门控自动过滤,无中场框架无法区分噪音和信号——因为它们都和用户问题在语义上相似。


7 讨论

7.1 中场设计的成本与收益

为每个垂类 Agent 构建双线规则库 + 蒙版梯度 + 请求灌注机制,其初始成本显著高于"直接接一个 RAG 管道然后让 LLM 自由发挥"。这个成本是否合理,取决于使用场景的风险等级。

对于低风险场景(闲聊客服、信息查询、模板化内容生成),中场的增量价值不值得其初始投入——LLM + RAG 的"够用"水平已经覆盖了需求。对于高风险场景(法律判决辅助、金融合规审查、医疗诊断支持),中场的价值不是"更好",而是"必须"——因为在这些场景中,输出的可追溯性、判断的可审计性和错误的可定位性不是加分项,而是准入门槛。

本文因此主张:中场的深度应与场景的风险等级匹配。 对于高风险垂类 Agent,中场的四个子模块(规则提取、蒙版激活、优先级编排、冲突裁决)需全部部署。对于中风险场景,可仅部署基础线规则 + 简化优先级。对于低风险场景,传统的 RAG + LLM 两步架构即可满足需求。

7.2 基础线规则的维护与演化

基础线规则一旦编码,并非永恒不变。学科共识随时间演化——法律被修订、医学指南被更新、工程标准被替代。基础线规则的维护需要建立定期的规则审计机制:每季度(或按学科变化频率)由领域专家审阅规则库,确认每条基础线规则是否仍然反映当前学科共识。

一个尚未解决的问题是:当学科共识本身出现分裂时(例如某个法律条文在不同学派的解读中存在实质性分歧),基础线规则应该如何编码?本文目前的处理方式是要求编码时显式标注争议——将"学界存在分歧"作为规则的一部分写入,并为不同解读分别编码为并列规则,由使用者(而非 Agent)选择采纳哪条。

7.3 个性线规则的 H 衰减

个性线规则的 H 字段是其可审计性的核心。但 H 会随着时间衰减——一条基于 2018-2020 年数据建立的客户成功规则,在 2026 年的市场环境中可能已经失效。框架要求在规则元数据中记录 H 的最后更新时间戳,并在 H 超过 12 个月未更新时自动附加"时效性警告"——该规则的 H 值可能不再反映当前现实。

H 衰减机制的设计原则是:让规则自然过期,而非等待它被证伪。 一条危害性最大的规则不是 H=0.2 的规则(因为 H 低所以 Agent 不会重用它),而是 H=0.9 但已经过时的规则(因为 H 高所以 Agent 重用它,但它的数据基础早已不适用)。

7.4 局限性

本文的工作在以下几个维度存在局限:

(1)中场操作化层的自动化程度。当前设计中,规则提取和优先级编排重度依赖人工编码。对于学科域多、规则量大的场景,人工编码的初始成本可能超出实践可行性。如何利用 LLM 辅助规则提取(从大量文档中自动挖掘候选规则,再由人工审核确认)是一个需要后续工程化探索的方向。

(2)蒙版梯度的动态调整。本文设定了蒙版在任务开始时计算并在执行中保持固定的约束。但在长链推理中,子任务的领域需求可能变化——一个起初属于客户成功管理域的分析,后期可能需要调用金融经济学域的知识。动态蒙版调整(在推理过程中根据子任务变化更新激活梯度)的工程实现和被滥用的风险需要进一步研究。

(3)个性线规则的跨从业者可移植性验证。本文声称个性线规则不可移植——但尚未提出一个系统性的验证方法来确认某条规则究竟是"可移植的基础线"还是"不可移植的个性线"。这个边界在某些情况下可能模糊(例如一条最初被认为是个性线的规则,在更大规模的验证中被证明是跨从业者有效的)。

(4)大规模规则库的冲突爆炸。随着基础线和个性线规则的累积,规则之间的潜在冲突呈组合增长。本文的优先级裁决机制在规则数量较小时有效,但在数千条规则共存时的可扩展性尚未被检验。


8 结论

本文从当前 AI Agent 工程实践的核心困境出发——检索与生成之间的"中场"缺位——提出了一套以操作化层为中枢的垂类 Agent 设计方法论。

该方法论的核心贡献可归纳为三个位移:

位移一:从"检索增强"到"规则建构"。 RAG 解决的是"能找到什么",规则建构解决的是"能信什么、能用什么"。将 RAG 降级为数据库、将规则建构升级为中枢,是对两个系统各自能力的诚实界定。

位移二:从"统一智能"到"双线架构"。 基础线编码学科共识(跨从业者一致、不可覆盖),个性线编码个人经验(域内有效、随人而异、H 持续校准)。两条线的共存使得 Agent 既不失学科根基,又不沦为"正确的废话"。

位移三:从"内部修复"到"请求灌注"。 传统 Agent 框架倾向于假设所有问题都可以在系统内部解决——换模型、扩蒙版、回溯重试。请求灌注承认某些问题的解决需要外部知识注入,而"承认不知道"本身就是认知诚实在架构层的实现。

这三个位移共同指向一个更根本的立场:Agent 的可靠性不是被训练出来的涌现能力,而是被精心设计的架构约束。 在中场缺位的时代,Agent 可以"听起来对";在中场补齐的时代,Agent 才有机会"实际上对"。

未来的工作方向包括:(1)中场操作化的半自动化工具链——利用 LLM 从大规模文档中自动提取候选规则,降低人工编码成本;(2)蒙版梯度的动态调整机制——在不破坏门控约束的前提下允许子任务级蒙版切换;(3)个性线规则的大规模验证——通过多从业者的规则库交叉比对,识别潜在的"隐性基础线规则"并推动其从个性线向基础线升级。


参考文献

[1] Lewis, P. et al. "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks." NeurIPS, 2020.

[2] Nanda, N. et al. "Progress Measures for Grokking via Mechanistic Interpretability." ICLR, 2023.

[3] Li, K. et al. "Emergent World Representations: Exploring a Sequence Model Trained on a Synthetic Task." ICLR, 2023.

目录
相关文章
|
11天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
11天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
844 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
11天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
857 7
|
11天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
11天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2313 6
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
11天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
1881 6
|
11天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
785 150
|
11天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
633 2

热门文章

最新文章