
引言:AI Agent 的“知识供给侧改革”
大模型时代的下半场,AI Agent(智能体)的瓶颈正在从“推理算力”转向“上下文供给”。
在企业级落地场景中,知识往往碎片化地散落在 Confluence、API 文档、数据库元数据以及各类共享网盘中。传统的 RAG(检索增强生成)模式频繁面临“检索噪声大、拼凑上下文易出错”的困境。
为了解决这一痛点,Google 悄然发布了 Open Knowledge Format (OKF) 规范(位于 knowledge-catalog 仓库的 okf/SPEC.md)。这是一个面向 Agent 时代的开放式技术规范。而就在两个月前,前 OpenAI 科学家 Andrej Karpathy 刚刚提出了 LLM Wiki 概念。
这两大风向的交汇,正揭示着一场面向 AI 的“知识接口统一运动”。本文将带你深度拆解 OKF 的核心架构,并与 Karpathy 的 LLM Wiki 进行横向对比。
深度解构 OKF:专为 AI Agent 设计的知识包装规范

1. 核心哲学:什么是 OKF?
OKF 既不是一个需要部署的底层软件,也不是一套复杂的 SDK,而是一个极简的、人类与 AI 共同可读的“知识包装规范”。
它倡导一种“去中心化、原子化”的知识管理方式:将复杂的知识点打碎成一个个独立的 Markdown 文件(称为 Concept,概念),并将它们组织在一个文件夹(称为 Bundle,知识包)中。
2. 三大极简结构
OKF 的设计可以用三个“Just”或标准件来概括:
Just Markdown(纯文本主体):内容主体完全基于标准的 Markdown。规范鼓励使用 Heading(一级/二级标题)、Table(表格)、Code Block(代码块)等强结构化排版,因为这种天然的“视觉锚点”能极大地帮助 AI Agent 准确提取语义。
Just YAML Frontmatter(元数据索引卡片):每个 Markdown 文件的最顶部都包含一段 YAML 格式的元数据(类似于图书馆的索引卡片):
唯一必填项:type(明确定义该概念的资产属性,如 Metric 指标、Table 数据库表、Runbook 运维手册等)。
高频推荐项:title(标题)、description(描述)、resource(指向 BigQuery 或外部实体资产的 URI 链接)、tags(标签)、timestamp(时间戳)。
Reserved Files(保留系统文件):
index.md(动态目录):这是 OKF 解决 Context 爆炸的核心。它支持 渐进式披露(Progressive Disclosure) 机制。Agent 在检索时,可以先阅读 index.md 了解全局目录,再精准打开关联文件,有效避免一次性加载成百上千个文档导致的“中间迷失(Lost in the Middle)”现象与高昂的 Token 成本。
log.md(审计日志):记录知识包的版本变更与演进历史。
OKF 样例文件示范:

—— 摘自 OKF 规范示例
3. 容错消费模型 (Permissive Consumption Model)
OKF 的设计哲学极其务实,采用了宽容消费模型。规范明确指出,消费这些知识的 Agent 不能因为文件缺少了某些可选字段、使用了自定义的 type,或存在失效的交叉链接而拒绝解析。
即便格式不够严谨,Agent 也应当将其退化为通用文档继续读取。这种“严律守己,宽以待人”的原则,极大地降低了企业数据生产者的门槛。
双雄并立:OKF 与 Karpathy 的 LLM Wiki 深度对比
在 OKF 发布的前两个月(2026年4月),Andrej Karpathy 在 GitHub Gist 上发布了 llm-wiki.md。从底层逻辑来看,Google 的 OKF 本质上是对 Karpathy 的 LLM Wiki 中“媒介层”的一种工业化与标准化落地。
1. Karpathy 的核心硬核理念:“先编译,后查询”
Karpathy 认为传统 RAG 存在天然的缺陷:每次用户提问时,系统临时从海量碎片中检索出几条 Snippets 喂给 LLM,这种“一次性组装”导致知识无法在系统内部沉淀和有机演进。
而 LLM Wiki 提倡:在输入端,当有新资料或新对话进入时,先让 LLM 将其“编译”成一个由 Markdown 构成、相互链接的本地知识库(如 Obsidian),形成知识图谱。Agent 只在这个已经高度结构化的 Wiki 内部进行检索。整个知识库通过 Ingest(输入) -> Query(查询) -> Lint(结构体检) 的闭环自主进化。
2. 核心差异多维对比矩阵

总结:大模型时代的“文本返祖”与标准之争
无论是 Karpathy 掀起的 LLM Wiki 风潮,还是 Google 迅速跟进标准化的 OKF,都揭示了 AI 时代知识形态的重大转变:知识正在向“对机器友好,对人类透明”的方向演进。
对人类透明:它不需要你把知识锁死在某个特定厂商的专有数据库或 SaaS 平台中。它只是一堆你用记事本随时可以修改、可以用 Git 进行版本控制的纯文本(Markdown)。
对机器友好:通过极简的 YAML 元数据和标准硬链接,AI 智能体无需任何复杂的插件,就能一眼看懂知识的类型、用途以及它们之间的关联拓扑网络。
如果说 OpenAPI 规范统一了 AI 智能体调用工具(Tools)的接口,那么 OKF 与 LLM Wiki 正在尝试统一 AI 智能体获取知识(Knowledge)的接口。
这标志着,AI 知识管理正在正式从事后检索的“传统 RAG”,走向事前治理的“知识重构(KAG/Wiki)”时代。对于企业架构师和开发者而言,及早布局标准化的文本知识组织方式,将是构建下一代高表现力 Agent 的核心护城河。
互动话题:你在开发 Agent 时是否也遇到了 RAG 检索不准、上下文爆炸的问题?你更看好轻量级的个人 LLM Wiki 还是企业级的 Google OKF 规范?欢迎在评论区分享你的架构思考!