review-verdict-revise-verify:语义也需要一道闸门

简介: 本文提出“语义闸口”理念:在AI生成Web UI的流程中,将负载安全逻辑从模型移至确定性编排,通过模式库、契约库与验证工具集三层Harness,锁住语义边界——确保“意思不漂移、样式可演进”,实现端到端可信。(239字)

Wu 等(2026)在论文审查领域做了一个闭环系统:

review → verdict → revise → verify

论文提交后,先审查、再裁决、再修订、再验证——四轮之后才允许进入下一环节。

这个闭环的核心设计,不是让 AI 自由裁量。

而是把**"负载承载的安全逻辑"从模型手里拿走,放到确定性编排**中。


一、审查可以交给 Agent,但裁决不能

审查可以交给 Agent。

判断可以交给 Agent。

修复也可以交给 Agent。


但——

什么时候停止?
什么时候阻断?
什么绝对不能改?


这些由硬逻辑说了算。

不由模型说了算。


这意味着:概率性生成的不确定性,被确定性规则锁在边界之内。Agent 在边界里面发挥理解力,边界本身不容谈判。


二、Code-Text-Code 的启示

《Specification-Based Code-Text-Code Reengineering》在代码层验证了一件事:

在转换链条中插入一层受控的规范层,把意思和语法解耦。

源代码和目标代码的语法完全不同,但中性文本规范把"意思"固定下来——无论怎么转换,意思不会漂移。


我在语义层做同样的事。

设计意图 → 语义契约 → Agent 生成 Web UI


设计意图是设计师脑子里的"这个场景下不能做什么":

  • 删除账户必须是红色空心
  • 必须二次确认
  • 文案必须说明不可恢复

Agent 生成 Web UI 时,样式可以变,框架可以变,但语义必须先被规范锁住。


两者都在做同一件事:在生成之前,先把意思固定下来。

论文用自然语言规范来解耦代码语法和代码语义。我用 YAML 语义契约来解耦 Web UI 样式和 Web UI 语义。


样式可以变,但语义必须被规范锁住。

不能变的(硬逻辑)

可以变的(AI Agent)

Critical 不能变成严重

文案措辞可以微调

删除不能变成确认

按钮大小可以调整

四种错误不能共用同一种红色

动画效果可以替换


三、Agent = Model + Harness

阿里云原生在拆解 Agent 底座时,给了一个等式:

Agent = Model + Harness

Model 是大脑。Harness 是缰绳。


没有 Harness 的 Agent 是脱缰的——它能跑,但不知道往哪跑,更不知道什么不能跑。

这比"安全对齐"更诚实。安全对齐试图让模型"自己知道什么该做、什么不该做",但概率性生成的不确定性决定了,模型不可能 100% 自律。


Harness 不依赖模型的自律。它在外部给模型套上一层规矩——

你不需要懂为什么,你只需要按规矩执行。


Harness 的核心是约束基建。规矩必须:

  • 可审计——写了什么、什么时候改的、谁改的,有迹可循
  • 可进化——业务变了,规矩跟着变,版本化管理,Diff 可见


阿里云在业务逻辑层和数据层做了这件事。

但当 Agent 的输出流向 Web UI 时,约束链断了。


四、约束链的断层

想象一条流水线:

数据层定义了字段语义
业务层定义了规则语义
策略层定义了模型标签语义
Agent 生成了一段文案、一个按钮、一个错误提示
用户看到了


数据层有约束:status_code=500 → "服务器错误"

业务层有约束:"服务器错误" → 值班员立即响应

策略层有约束:"Critical" → 情绪权重最高


但到生成 Web UI 这一步,约束链断了。


Agent 把 status_code=500 渲染成界面时,可能写成:

  • "Something went wrong"(语义降级)
  • 按钮做成蓝色实心(样式错误)
  • 四种错误全部用红色(分级缺失)

后端的规矩再严密,语义层没有约束,等于零。

这不是前端的锅。前端按设计稿实现了,设计稿按规范画了,但规范写在文档里,Agent 生成内容时没读。


Agent 按概率生成,每次输出的文案、颜色、样式可能不同——语义在生成过程中漂移了。

约束链止于业务逻辑层,语义层是空白。

这是端到端可信的缺口。


五、语义闸口:在转换链条中插入受控的规范层

这个解耦方法在语义层有三个实现环节。

发现意思在哪里可能跑偏——模式库

不是截图记笔记。

是按组件类型做结构化归档:

组件类型

语义属性

典型漂移

Alert

type: success/info/warning/error

多种错误共用红色

Button

type + danger + ghost

高危操作做成普通样式

Modal

type: confirm/info/success/error

拒绝和终止混为一谈

Progress

status: wait/process/finish/error

阶段标签模糊

当 Agent 生成的输出与组件手册中的语义定义出现偏差时,记录为模式。


把意思写成机器能懂的规矩——契约库

规矩不是写在文档里让人读。

是写在代码里让机器执行。

# contract/ACT-001.yaml
组件: Button
组件手册依据:
  Props:
    - type: primary / default / dashed / link / text
    - danger: true / false
    - ghost: true / false
绝对不能碰的红线:
  - 禁止: semantic_domain=destructive 时,type 不是 primary 或 danger=false
  - 禁止: 缺少 Modal.confirm 二次确认
颜色背后的意思:
  destructive_action:
    组件手册映射:
      Button: { type: "primary", danger: true, ghost: true }
      Modal: { type: "confirm", okType: "danger" }

删除按钮的 type 必须是 primarydanger 必须是 trueghost 必须是 true——这些不是建议,是约束。

契约买的不是"生成能力",是**"可审查性"**。


证明意思没有被跑偏——验证工具集

输入一段文案或 Web UI 描述,自动判断是否符合契约,给出通过/不通过。

不是人眼走查,是机器自动审查。

不是"感觉好多了",是有明确的测试标准和通过准则:

  • 单元测试:单组件语义合规性 → 准确率 ≥ 90%
  • 集成测试:多组件语义一致性 → 100% 匹配
  • 回归测试:规范迭代后兼容性 → 通过率 100%


三个环节叠加,形成语义层的 Harness:

发现漂移(模式库)
裁决契约(契约库)
修订生成(Prompt 注入)
验证锁定(验证工具集)

意思在生成之前被固定,样式在规范之内被允许漂移。

这才是端到端可信——从决策到呈现,每一层都有约束、每一层都可审计。


六、为什么现在必须做

以前 Web UI 是人画的。

设计师画什么,前端做什么,语义不会变。

现在 Web UI 是 Agent 生成的。

同一个需求,Agent 每次生成的文案、颜色、样式可能不同——语义一致性从"确定性"变成了"概率性"。


传统设计系统管的是像素级一致性:

  • 颜色
  • 字体
  • 间距


但 Agent 生成时,像素对了,语义可能错了:

像素对了

语义错了

颜色是红色

但四种错误全部用红色,没有分级

文案是中文

但 Critical 变成了严重,情绪降级

按钮有圆角

但删除做成了蓝色实心,没有二次确认

这些不是视觉回归能捕获的问题。

视觉回归检查"长什么样"。

语义闸口检查"意味着什么"。


Agent 时代,约束基建必须从业务逻辑层延伸到语义层。

否则后端的规矩再严密,Web UI 的语义没有闸口,用户看到的仍然是"意思跑偏了"的界面。


一句话

Agent = Model + Harness。

Harness 不能只套在业务逻辑层,必须延伸到语义层——从决策到呈现,每一层都有约束、每一层都可审计。

review-verdict-revise-verify 的闭环不是论文审查专属,是任何概率性生成系统的通用原则:负载承载的安全逻辑,必须放在确定性编排中。

语义也需要一道闸门。

相关文章
|
6天前
|
人工智能 小程序 程序员
Skill详解(2万字详细教程),Skills是什么,如何安装并使用Skills
AI时代必备技能!Skills(智能体技能)是Anthropic提出的可复用能力包,以文件夹形式封装指令、脚本与资源,实现“按需加载”,大幅节省Token。它让大模型从聊天工具升级为专业助手——非技术岗也能零代码快速上手,真正实现人人可用、岗岗必备。
Skill详解(2万字详细教程),Skills是什么,如何安装并使用Skills
|
5天前
|
人工智能 JSON API
AI Agent 完全入门:从“大模型”到“能干活”的智能体,一篇讲透
本文深入浅出解析AI Agent本质:非 merely 工具调用,而是“感知-规划-记忆-工具”四层闭环的行动系统。对比普通大模型“只生成答案”,Agent能自主拆解目标、多步执行任务。聚焦测试场景,详解其在自动生成数据、UI自愈、智能断言三大落地点的实效价值。
|
2天前
|
机器学习/深度学习 人工智能 监控
8类工地安全防护用品检测5200张数据集分享
本数据集含5200张真实工地实景图像,精细标注8类安全目标(安全帽、反光背心、施工人员等),YOLO格式,开箱即用。适用于智慧工地监管、PPE合规检测及YOLOv5-v11等模型训练,助力工业安防与目标检测研究。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
构建AI智能体:九十、图解大模型核心三大件 — 输入编码、注意力机制与前馈网络层
本文深入解析了大模型三大核心技术:输入编码、多头自注意力机制和前馈网络层,从应用视角阐述了它们的工作原理和协同效应。输入编码负责将文本转换为富含语义和位置信息的数学表示;多头自注意力机制通过多专家团队模式建立全局依赖关系,解决长距离依赖问题;前馈网络层则通过非线性变换进行深度语义消歧。文章通过可视化示例展示了词向量的语义关系建模、注意力权重的分布模式以及前馈网络的语义过滤功能,形象地说明了大模型如何通过这三层架构实现"广泛联系-深度加工"的认知过程。
372 5
|
6月前
|
传感器 存储 人工智能
构建AI智能体:五十一、深思熟虑智能体:从BDI架构到认知推理的完整流程体系
本文系统介绍了深思熟虑智能体(Deliberative Agent)及其核心BDI架构。智能体通过信念(Beliefs)、愿望(Desires)、意图(Intentions)三个核心组件实现复杂决策:信念系统维护环境认知,愿望系统管理目标设定,意图系统执行行动计划。文章详细阐述了智能体的状态管理、推理机制和完整决策流程,并通过一个学术研究助手的设计示例,展示了如何实现从环境感知、计划制定到执行反思的完整认知循环。这种架构使智能体能够进行深度思考、规划和学习,而非简单反应式响应,代表了人工智能从工具性向认知性
732 5
|
11天前
|
人工智能 弹性计算 Serverless
2026 年企业 AI Agent 落地:从 Demo 到生产的四个关键跨越
本文剖析AI Agent从Demo到生产落地的四大关键跨越:长时任务支持、多Agent协同、GPU弹性伸缩与全链路可观测性,并结合Google ADK、Anthropic MCP等新协议,给出务实解法与平台选型建议。
|
1月前
|
机器学习/深度学习 人工智能 算法
DeepSeek 怎么导出 Word?保存对话、公式和表格的几种方法
DeepSeek本身不支持直接导出Word,但可通过三种方式高效保存:①直接复制(适合纯文本);②Markdown转Word(适合技术用户);③推荐使用DeepShare插件——一键导出单条/多轮对话,保留标题、表格、代码块及LaTeX公式,支持模板定制与格式优化,大幅提升文档交付效率。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
构建AI智能体:十三、大数据下的“搭积木”:N-Gram 如何实现更智能的语义搜索
N-gram是一种基于上下文的统计语言模型,通过前N-1个词预测当前词的概率,广泛应用于文本生成、输入法预测、语音识别等领域,具有简单高效、可解释性强的优点,是自然语言处理的基础技术之一。
795 10
|
2月前
|
存储 自然语言处理 安全
大模型应用:医疗行业大模型:从生成前校验到生成后审计的应用实践.73
本文提出医疗大模型“生成前校验+生成后审计”全链路管控方案,通过输入完整性/合规性校验、隐私脱敏、标准化处理,及输出格式/准确性/隐私审计等闭环流程,确保病历撰写、医嘱辅助等场景安全、合规、准确落地。
476 7

热门文章

最新文章