老金带着实操图来案例更新后的Meta_Kim了,Claude Code、Codex等多平台兼容

简介: Meta_Kim 是一个面向AI长任务的治理框架,通过 Critical(意图澄清)、Fetch(能力发现)、Gate(执行闸门)、Dynamic Workflow(动态工作流)、Review(过程审查)与 Evolution(经验沉淀)六大机制,解决AI失控、边界模糊、决策黑箱等问题,让AI“该停时停、该问时问、该记时记”,已在Claude Code/Codex实测,开源可扩展。

Image

最近老金在参加AMD的一个AI比赛,正好赶上Meta_Kim这段时间更新了很多东西,我就顺手把它再拿出来讲一遍。先把边界说清楚,这篇只能讲一部分主框架,不是完整说明书。

Meta_Kim里面还有不少东西这次不会展开说。比如安装方式、全局能力发现、agents和Commands、MCP和skills。再往深一点,还有Claude Code和Codex的多平台投影、OpenClaw和Cursor兼容、Hook自动化、状态存档、Graphify知识图谱、SQL向量记忆、动态回滚和进化回写。

这些光看一篇文章很难吃透,最好自己去GitHub看README,再实际跑一遍。

GitHub地址:https://github.com/KimYx0207/Meta\_Kim

对,你最近看到我开源的所有你觉得好用的各种Skills,或者hook等,都是直接从Meta_Kim里剥离出来的小玩意。

都在上面Github的主页上能看到各个仓库。

这次按图来讲解,先看原始输入,再看决策怎么边做边补全,再看能力发现、发牌、状态、审查和记忆。文章只负责把主链路讲明白,剩下那些更硬的部分,留给GitHub和你自己的实操。

以前我讲Meta_Kim,讲的是原理,什么治理层、动态工作流、记忆系统。懂的人会点头,更多人会卡在第一步,这东西到底跟我有什么关系。

换成一句人话,Meta_Kim管的是AI长任务里的失控感。你让AI改项目,它第一轮很积极,第二轮开始扩范围,第三轮跑了几个命令就说完成。可你回头看,根本不知道它证明了什么,也不知道哪些选择是你确认过的。

Meta_Kim给这种长任务加了一条治理链路。它先问清目标,再找全局能力,再拆任务,再执行,再审查,再验证,最后把经验沉淀回记忆里。下次再遇到相似任务,它不会只靠上下文硬猜,也不会靠一句我已经完成来收工。

Image

第一张图就是开头。我的原始需求只有一句,我想做个公众号写作增长的系统。普通AI很容易直接开始写方案,甚至直接建文件。

Meta_Kim先把问题摊开,问核心目标是什么,第一版验证什么,当前起点在哪里,主要服务谁。

这一步叫 Critical,可以理解成入口判断。它先看这句话能不能直接开干,不能开干就把模糊意图拆成可选路线。

公众号写作增长系统可能是选题系统,也可能是数据分析系统,还可能是发布自动化系统。三个方向都叫增长,第一步完全不一样。图里它把路线摆出来,让人选,没有替人偷做决定。

Image

Fetch阶段不是直接开搜,而是边推进边继续弹出决策点。

Meta_Kim不是只在开头问一次,然后一路自己跑完。它会随着任务往前走,继续把关键决策点弹出来,让人的意图变得更具体。

图里已经到了 Fetch 阶段,也就是准备收集证据和发现能力。系统先把前面锁定的内容列出来:核心目标、服务对象、起点、垂直领域、交付形态、AI边界、技术背景、首发模型、发布频率。然后它继续问,下一步证据要看哪里,写作风格怎么定,人的介入点放在哪。

这就叫边做边丰满决策。比如用户一开始只说想做公众号写作增长系统,这还不够。走到Fetch时,Meta_Kim会继续问技术背景是独立开发者还是运营团队,首发内容是深度原创还是快速复盘,发布节奏是周更还是日更,证据范围要看官方规范、起量案例、本地工具栈,还是AI全流程介入的现状。人把这些选完,AI再进入证据检索和执行。

Image

第三张图讲 Gate。Gate就是闸门,AI要动文件、改配置、改变任务范围时,不能靠一句我知道了继续往下跑。它必须说明要动哪里,为什么动,动完怎么验。图里这次拦的是批量新建文件。GateGuard发现每次创建文件都要报备,最后把节奏改成保持现状,逐一报备。

这张图对应的是一个习惯,AI每次要动项目结构时都要把动作摊开。人的限制条件被写进任务,后面的步骤要照着执行。我以前最怕AI长任务的地方,就是它嘴上说尊重边界,手上继续改一堆东西。Gate就是专门拦这个的。

Image

第四张图进入 Fetch和全局能力发现。很多人看到Fetch会想到联网搜索,但Meta_Kim里的Fetch更宽。它是在开干前把能用的能力找全,把证据拿出来,再决定谁去做。

这里的能力池不只有 Skill。它还会找 Agent、MCP、Tools、Command、运行时工具、Hook、Graphify知识图谱、Memory记忆、项目脚本和配置。Agent是被分配了边界任务的执行单元,像一个临时工位。Skill是可复用的方法,比如公众号写作、质量检查、代码审查。MCP是外部能力连接器,数据库、浏览器、记忆服务、图像生成都可以通过它接进来。Tools是当前环境真实能调用的工具。Command更像已经做好的按钮,点下去就能跑检查或生成报告。

这张图的价值在于,它把AI从单点猜测拉到能力检索。系统会看这次任务该调哪些能力,哪些能力只是发现了,哪些真的调用了,哪些只是选中但没有执行。发现能力,不等于调用能力。调用能力,也不等于任务完成。最后还要看验证结果和用户目标有没有闭合。

Image

第五张图是 Dynamic Workflow和 LangGraph。

Dynamic Workflow就是动态工作流,意思是不同任务走不同路线。公众号写作增长这个任务,需要内容、产品、集成、发布、反馈、进化。它不需要前端大界面,也不需要数据库,所以图里有的通道启用,有的通道省略,有的只做监控。

LangGraph在这里可以理解成节点、边和状态。任务被拆成一个个节点,节点之间有依赖关系,每一步走到哪里都写进状态。下面的worker task packet就是任务包,每个包都要说明输入、输出、依赖和合并方式。图里还有Capability Invocation Truth,也就是能力调用真相表。它把能力分成invoked、discovered_not_selected、selected_not_invoked、unavailable、unknown。这样AI就不能把看见了说成用过了,也不能把选中了说成跑通了。

Image

第六张图讲发牌策略。发牌这个词听着虚,其实很具体。任务走到岔路时,系统把下一步选择做成几张决策卡,让人选,再让AI按选中的牌继续做。

图里展示的是一个选择汇总,还没到最终执行结果。

上一轮编排与能力发现被弱化,本轮要不要补全。fabric CLI不在PATH上,要不要换AI CLI引擎。MCP图像生成能力已经可用,要不要接入。这个时候AI自己继续跑,很可能直接改脚本,或者绕过某个依赖往下写。Meta_Kim必须停下来,把牌发出来。

补全能力发现这张牌,是问这轮要不要把缺掉的全局能力补回来。fabric依赖这张牌,是问继续修原工具,还是换成别的AI CLI引擎。人选完,AI再继续。发牌策略的本质就是把关键分叉显性化,把决策权交回人。证据不足就回Fetch补证据,路线不对就回Thinking重排任务,执行中发现风险就暂停或改牌。它给长任务留下了能停、能问、能退的机会。

Image

第七张图讲 State。State就是状态账本,AI现在走到哪一步,哪些阶段完成了,哪些阶段还是pending,是否允许交互选择,是否开始执行,都会被记录下来。

咱不用记字段名,只要记住一点:Meta_Kim不听AI嘴上说完成,它看状态、产物和验证记录。

这也是我一直想做的边界。AI说自己完成,只能算一句话。它提交了可检查的东西,才算进入验收。

Image

第八张图是 Review。这里的Review不负责润色和夸人,图里这个Review worker在做上游审查。它会检查Critical、Fetch、Thinking三个阶段有没有真的锁住目标,也会检查能力有没有找全。owner、weapon、dependency、runtime、OS、verification这些关键项有没有对齐,也要在这里过一遍。

它甚至会追问,上一轮有没有把agent和能力实际调用起来,还是主线程自己悄悄做完了。

这就是Meta_Kim比较硬的地方:不只审最后结果,也审前面的决策过程。前面路线错了,后面写得再漂亮也不能算好。

Image

第九张图继续往后。Meta-Review负责复查Review标准有没有到位。Verification负责验证,必须看真实命令、运行记录、文件结果,不能只看AI总结。Evolution负责进化回写。它会判断这次有没有可复用经验、避坑规则和能力缺口,也会判断有没有内容需要写回skill、agent、command、contract、memory或graph。

图里还有none-with-reason。它要说明这次不写回的理由。记忆不是垃圾桶,能沉淀的才沉淀,不能沉淀的要说明原因。

Image

后面两张图讲记忆。这张是Graphify知识图谱,可以理解成项目地图。项目越做越大,AI每次全仓乱翻就会慢,也容易漏。Graphify把文件、模块、概念之间的关系梳理出来,让AI下次知道从哪里找证据。

它不替代源码,只帮AI少走弯路。真正判断仍然要回到文件、运行记录和用户目标。

Image

这张是向量记忆。Graphify更像项目地图,向量记忆更像会话经验库。它负责接住过去的任务、判断、教训和上下文。下次遇到相似问题时,AI可以把相关经验找回来,少一点从零开始猜。

所以三层记忆不用死背。项目规则和能力记忆负责留下可复用的做法,Graphify负责给项目画地图,SQL和向量检索负责把会话历史接回来。它们合在一起,AI才有机会越用越懂项目。但我也不把它吹成永远正确。记忆负责减少失忆,最后仍然要看Review、Verification和用户确认。

所以这次老金重新安利Meta_Kim,重点不在我又做了一个新工具。AI编程会越来越强,长任务会越来越多。到那时候,真正值钱的能力会变成让AI在一个可控闭环里做事。

模糊意图要先问清,做着做着还要继续补齐决策。能力要先找全,任务要能拆,执行要有闸门,关键岔路要发牌给人,结果要能审查,验证要有证据,经验要能复盘和沉淀。

这就是更新后的Meta_Kim想做的事。

它让AI在该动手的时候动手,在该停下来的时候停下来,在该问人的地方把牌摊出来。

希望老金做的这玩意对你有所帮助,虽说我只在Claude code和Codex进行了实测,但是它理论上是通用的,你可以在任意平台进行使用。

有用的话,记得帮我在Github上给个Star,它能让更多的人看到它。


飞书****开源知识库(实时更新 交流群):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

相关文章
|
4天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1595 2
|
1天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
350 123
|
4天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
591 4
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
15天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
15天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
919 12
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
8天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
675 0
|
3天前
|
消息中间件 人工智能 Kafka
AI 时代,实时入湖正在告别 ETL:从 Kafka 到 Iceberg 的架构减法
本文围绕“零 ETL”这一趋势,讨论流数据入湖为什么需要做架构减法,并结合 Kafka × Table Bucket 的实践,分析一种将通用入湖能力前移到消息与表存储链路中的方案,如何在降低复杂度的同时,兼顾实时性、一致性、Schema 演进、CDC 语义与开放生态兼容。
193 121
|
3天前
|
人工智能 监控 前端开发
Electron 监控:让桌面 Agent 监控触手可及
一行代码实现Electron桌面端全景监控,自动还原崩溃现场、预警内存泄漏、全链路追踪、 SSE流式响应与交互埋点,让 AI 助手运行状态清晰可见,助力快速恢复稳定与流畅。
184 125
|
11天前
|
人工智能 自然语言处理 算法
阿里云百炼Qwen 3.7 Plus与Max实测全解:性价比与多模态能力、成本深度对比
2026年,阿里云百炼平台推出的Qwen 3.7系列成为企业与开发者落地AI应用的核心选择,其中Qwen 3.7 Max与Plus作为两大旗舰版本,定位差异显著:Max是纯文本推理旗舰,专注高强度智能体与复杂逻辑任务;Plus则是多模态全能版,在保留强大文本能力的同时,补齐图像、视频理解能力,且价格大幅降低。本文基于2026年最新实测数据,从核心参数、文本能力、多模态能力、智能体表现、性价比与场景选型六大维度,全面解析两款模型的差异,为用户提供精准选型参考。
545 0