一、场景定义:单体Agent的三类结构性瓶颈
复杂业务决策(如供应商选择、全链路优化、多维度风险评估)往往涉及跨域知识融合与长程逻辑推理。单体Agent在此类场景中面临三类瓶颈:
认知宽度不足:单模型难以同时覆盖财务、法务、工程、风控等多领域知识
长程专注度衰减:上下文长度限制导致复杂任务执行中途遗忘初始约束
自我纠错盲区:幻觉与逻辑漏洞在单视角推理中自洽,缺乏外部校验机制
多Agent集群通过协作机制拆分认知负载,但"如何协作"本身是一个架构问题
枢衡集群经过30次崩溃复盘与20+智能体实战迭代,逐步识别出四种协作形态,分别对应不同任务确定性与协作深度的工程需求
二、四种协作模式的工程定义与边界
2.1 路由模式:中心分发与职能匹配
【工程背景】: 枢衡v1.0初期采用全员广播机制,所有Agent共享同一上下文池,导致严重的通讯熵增与逻辑踩踏。例如,审计Agent(CAD)在执行Agent(EMD)尚未完成计算时即介入质疑,引发状态冲突
【架构响应】: 设置中心分发节点SDC,即TL,通过意图蒸馏(Intent Distillation)将输入请求映射为带维度标签的指令草案,再按Embedding相似度(如阈值0.85)精准分发给各职能代理(Expert)。聚合器(Aggregator)对多代理输出的[Belief]与[Desire]进行结构化对撞校验,未达置信阈值时触发二次路由
【通信拓扑】: 星型网络。中心节点负责任务解析与匹配,职能代理彼此解耦,新增或移除代理不影响调度逻辑
【适用边界】:
任务类型相对明确,职能代理的能力边界清晰;
任务间耦合度低,无需跨域深度协作;
对实时性要求高于对一致性的要求。
【失效信号】: 当任务频繁触发二次路由,或单任务需要跨3个以上代理接力完成时,纯路由架构的上下文传递成本将超过收益
2.2 委托模式:闭环交付与纵向隔离
【工程背景】: 路由解决了"发给谁",但未解决"发出去之后如何保证交付"。在1688供应商资质审核场景中,资源代理(RDD)不断将中间结果抛回中心节点请示,导致上下文池被半成品污染,决策代理(SDC)被迫频繁切换注意力
【架构响应】: 引入经理-员工结构。经理代理(Manager)维护全局上下文,将复杂任务递归拆解为原子子任务,分发给员工代理(Worker);员工在独立子线程中执行,仅在有明确交付物或触发中断阈值时向上归约。人在回路(HITL)在执行前审查拆解合理性,在执行后验收最终产出
【通信拓扑】: 有向树。指令自上而下逐级传递,结果自下而上逐级汇聚,员工节点间不直接通信
【关键机制】:
递归分解:任务拆解至原子化单元,每层定义明确交付标准作为递归终止条件;
分发与归约:数据按批次切分后并行处理,最终归约汇总。枢衡实践中,50家候选供应商被切分为5个批次并行处理,人工审核耗时从2小时压缩至10分钟;
中断机制:被动中断(风险阈值自动监测)与主动中断(阶段节点人工确认)。在虚拟投资实验中,资产净值触及-3%预警线时强制挂起,等待物理确认

【适用边界】:
任务可递归拆解,子任务间依赖关系明确;
需要长程专注执行,而非频繁交互;
存在明确的验收标准,适合闭环交付
【失效信号】: 当交付结果存在主观判断空间,或需要多视角交叉验证时,仅靠经理验收不足以发现深层逻辑漏洞
2.3 辩论模式:对抗校验与质量收敛
【工程背景】: 委托模式保证了执行深度,但无法保证决策正确。在C2M材料决策实验中,决策代理(SDC)提议采用银离子喷涂技术解决防臭痛点,逻辑自洽且技术可行;但审计代理(CAD)通过RAG实时调取欧盟REACH法规库,指出环保准入风险与BOM成本突破15%利润红线。若无对抗机制,该方案将直接流入生产环节
【架构响应】: 引入三角对抗结构。正方(Proposer)生成初始方案并防御;反方(Challenger)系统性审视逻辑漏洞与事实错误;法官(Arbiter)主持多轮交锋并裁决收敛。辩论轮数设硬性上限(通常3-5轮),结合终止条件(核心分歧不影响最终决策时提前收敛)
【通信拓扑】: 三角闭环。正方与反方直接对抗,法官独立于双方之外,必须具备显著强于正反方的推理能力,否则易被更有说服力的论证带偏而非做出准确裁决
【关键机制】:
- 对抗暴露盲区:强制正方面对反例与边界条件,打破单视角自洽幻觉;
多轮交互强制深度:每轮发言必须直接回应对手上一轮论证,维持上下文一致性;
RAG事实锚点:反方在质疑时实时调取外部数据,使辩论从逻辑互搏升级为事实校验
【适用边界】:
高风险决策,存在显著的主观判断空间;
需要多视角交叉验证,且正反方有明确的能力偏向;
任务目标清晰,足以形成可辩论的提案
【失效信号】: 当任务本身模糊不清,连正方都无法形成初始提案时,辩论无从发起
2.4 群体模式:环境涌现与去中心自治
【工程背景】: 上述三种模式均依赖知道全局、能做出判断的中心节点(路由器、经理、法官)。但在枢衡集群运行中,某些最优行为并非来自中心指令:当通讯熵增超过临界点(5022警告)时,系统自发产生Dehydration(脱水/压实)动作以防止上下文崩溃——这不是预设代码,而是集群为生存自发涌现的负熵行为
【架构响应】: 构建共享环境(Shared Environment)作为间接通信介质,个体代理通过修改环境状态(如Task_Status字段)实现Stigmergy式协作,而非显式点对点通信。代理遵循硬编码的BDI局部规则(如CAD的"职业怀疑"、EMD的"对价执行"),在异步交互中动态交接。宏观层面的审慎决策与自我修复通过涌现产生
【通信拓扑】: 网状或场状。无中心节点,无指令链,决策权从中心转移至最接近具体问题的节点

【关键机制】:
留痕:生产者通过共享环境写入状态,消费者根据环境变化响应,实现解耦;
动态交接:代理在需要协助时直接锁定最可能帮上忙的节点,无需中心审批;
涌现:微观局部规则通过大量并行互动产生不可预见的宏观复杂行为
【适用边界】:
任务本身模糊不清,中心节点无法预设答案;
系统需要容错能力,允许局部节点失效而不中断整体任务;
对实时一致性要求低,对自适应能力要求高
【当前工程差距】: 枢衡目前仅在通讯熵增临界等少数场景观察到涌现行为。全面群体化需要激励相容机制(博弈分值)与异步环境通信的成熟
三、四种模式边界对比矩阵

四、关键架构决策
决策1:路由 vs 委托的切换阈值
当任务链路超过3个Agent节点,或涉及长程复杂工程时,委托模式的递归分解与中断机制比纯路由更具可控性
切换标志:若Agent频繁将中间结果抛回中心节点请求指示,说明路由架构的上下文传递成本已超过收益
决策2:辩论模式中法官模型的能力要求
正反方可用能力中等但偏向性明确的模型以形成真实对抗,但法官必须使用推理能力更强、立场更中立的模型
若法官逻辑能力不足,面对双方交锋时易被更有说服力的论证带偏,而非做出准确裁决。这是辩论模式的效果上限决定因素
决策3:群体模式的培育边界
群体模式并非万能
当任务目标明确、验收标准清晰时,中心节点(路由/委托/辩论)效率更高。仅当任务本身模糊不清、连中心节点也无法预设答案时,才适用群体模式
全面群体化需要激励相容机制与异步环境通信的成熟
五、复盘与演进
枢衡集群经过30次崩溃复盘与20+智能体实战迭代,验证了四种模式从"能用"到"好用"到"可靠"到"智能"的递进关系
当前系统在处理供应链资质审核、投资模拟、C2M材料决策等场景中,任务完成率与决策一致率显著优于单体Agent方案
下一步架构演进聚焦三个方向:
【强化信息素环境】:将local_capital.db从存储库升级为信号场,任务流转通过Task_Status状态变化驱动;
【引入博弈分值机制】:为Agent设置对价分值,发现重大错报风险或制定高收益方案时加分,通过自利驱动逼近帕累托最优;
【设定护栏与放任冗余】:以"最大回撤-5%"与"会计准则一致性"为最高护栏,减少执行路径干预,容忍短期冗余以换取涌现创新
- 最初的【枢衡】

- 现在的【枢衡】

参考与致谢
本文关于多Agent集群协作模式的理论框架,参考了黄佳老师所讲的的分类体系相关知识
文中涉及的【枢衡】智能体集群架构设计、BDI治理协议、供应链沙盘实践数据及效果指标,为作者独立落地成果
【看山 Agent 架构】
工信部 AI 技术应用(高级)认证
30次集群崩溃复盘 | 20+智能体实战
深耕 Agent 集群架构,用商科思维重构复杂系统效率
注:本文内容由 AI 辅助创作,作者对内容结果负责