养龙虾的技术内幕:一个开发者的OpenClaw完全拆解

简介: 本文深度解析开源智能体框架OpenClaw(“龙虾”):从三层解耦架构、按需加载的Skills技能系统,到真实CVE漏洞与国产“xxClaw”技术路线对比,聚焦源码级实现与工程实践,助力开发者由“养虾人”进阶为“造虾人”。

今年AI圈打招呼的方式变了:“你养龙虾了吗?”

“龙虾”并非水产,而是开源本地自主智能体框架OpenClaw——2025年11月由奥地利iOS工程师Peter Steinberger发起,2026年1月30日正式定名。截至2026年初,这个项目在GitHub上已狂揽25万Star。

作为一个写代码的人,我对“养虾”这件事的关注点不在概念包装,而在技术实现。这篇文章,我们不聊虚的,直接扒开OpenClaw的源码外衣,从架构设计、执行链路、安全漏洞到国产“xxClaw”军团的技术路线,逐一拆解。

一、OpenClaw核心架构:三层解耦,各司其职

OpenClaw异于传统Agent框架(如LangChain)的地方在于:它是一个 “云端大脑+本地肢体” 的结构。

Orchestrator(大脑) :通常部署在GPU集群或云端,负责LLM推理和任务拆解。

Gateway(协议桥) :负责鉴权、流量整形以及将LLM生成的JSON指令翻译成特定环境的指令集。Gateway本质上是一个HTTP和WebSocket服务,启动时与注册的Channel(如Telegram机器人)建立WebSocket长连接。核心实现位于src/gateway/server.ts,通过@route_to_executor装饰器做上下文压缩(Context Pruning)。

Gateway通过系统服务管理保持24×7运行:

bash
 代码解读
复制代码
# macOS
launchctl load ~/Library/LaunchAgents/ai.openclaw.gateway.plist
# Linux
systemctl --user enable --now openclaw-gateway.service

Pi-embedded(执行端) :运行在Mac/Linux或树莓派上,真正执行Python脚本、截图或点按鼠标。这是OpenClaw最硬核的部分——进入packages/pi-embedded/runtime,你会发现它并没有直接调用系统的subprocess,而是实现了一套名为 “Cell Isolation”的沙箱机制。核心执行引擎包含两个模块:

  • Environment Snapshot:执行前先快照当前环境变量
  • Skill Loader:动态加载.ocskill文件

工程避坑点:Pi-embedded默认在独立的venv中运行。自定义Skill找不到第三方库时,需要在claws.yaml中明确定义dependencies,由执行端在启动时自动静默安装。另外,Gateway默认使用Redis维护节点心跳,如果Redis挂了或网络延迟大,指令会在Gateway堆积。

完整调用链(以“查CPU温度并生成图表”为例):

javascript
 代码解读
复制代码
Orchestrator → 识别System_Monitor技能,生成JSON指令
Gateway → 验证签名,查找在线Pi节点,封装Protobuf通过WebSocket发送
Pi-embedded Receiver → 解包
Sandbox → 启动临时Python进程,挂载传感器权限
Skill Execution → 执行get_temp.py
Callback → 结果(图片二进制流)沿原路返回

二、Skills技能系统:教AI“如何做事”

Skills是OpenClaw的核心扩展机制。每个技能都是一个目录,包含一个带有YAML frontmatter和Markdown指令的SKILL.md文件

Skills采用 “渐进式披露”设计原则——元数据、核心指令和资源文件分层加载,在保证功能完整性的同时节省上下文空间,使OpenClaw能同时支持数十个技能而不影响响应质量。

与传统插件系统的关键差异:

特性 传统插件系统 OpenClaw Skills
加载机制 启动时全量加载 按需动态加载
配置复杂度 需要注册表、依赖注入 仅需SKILL.md文件
上下文占用 常驻内存 按需加载
调试方式 需要重启服务 热更新,即时生效

技能按功能可分为工具型(命令行/API封装)、数据型(数据库/文件处理)、AI型(NLP/图像识别)等。

开发建议:Skills官方文档强调两条原则—— “保持精简” (指示模型要做什么,而不是如何当AI)和 “安全优先” (如果技能使用exec,确保提示不允许来自不受信输入的任意命令注入)。

三、安全漏洞:CVE清单与攻击面分析

OpenClaw的安全问题不是概念性的,而是有实打实的CVE编号和PoC的。

已公开的CVE漏洞

  • CVE-2026-53826(CVSS 4.2):OpenClaw 2026.4.25及之前版本存在信息泄露漏洞,可远程触发
  • CVE-2026-53810(CVSS 7.4/8.8):OpenClaw 2026.5.17及之前版本存在权限提升漏洞(CWE-829),可远程攻击
  • CVE-2026-44113(CVSS 7.7):OpenShell中的TOCTOU竞态条件,允许攻击者将安全文件路径替换为符号链接,绕过沙箱读取挂载根目录以外的文件
  • CNVD-2026-18601:OpenClaw远程代码执行漏洞
  • Active Memory Write Scope权限提升:OpenClaw 2026.5.6之前版本,Gateway operators可通过operator.write权限修改全局配置

三大攻击路径(国家资通安全研究院实测报告):

  1. 间接提示词注入:攻击者在正常网页中以零尺寸<span>元素和HashJack URL fragment隐藏恶意指令。OpenClaw读取后即被劫持,可列目录、读凭证、删日志、外泄数据。Telegram的Link Preview机制会形成二次外泄管道
  2. 伪装技能:攻击者将恶意指令写入技能包(如伪装的“天气查询”技能),安装和执行全程不触发任何安全警告。用户查询天气的同时,Gateway Auth Token已在后台被窃取
  3. 长时间运行导致安全守则遗忘:OpenClaw在长时间运行后可能丢失初始安全约束

此外,FreeBuf的研究指出,提示词注入在整个行业内基本仍未解决,且没有任何标准规定消息对象在到达LLM前应如何序列化。攻击者可以在图像底部嵌入与背景色几乎一致的指令文字,受害者分享图片给AI后即可触发。

四、国产“xxClaw”军团:技术路线横向对比

基于2026年3月的权威测评数据,国产AI智能体已形成清晰的技术分化。

第一类:大模型厂商——模型+Agent一体化

StepClaw(阶跃AI) :采用“桌面端+云端”混合架构,技术架构分三层:

  • 感知层:集成多模态编码器,支持文本/图像/语音联合理解
  • 决策层:强化学习驱动的任务规划模块
  • 执行层:5000+可组合技能模块

AutoClaw(智谱) :深度集成专为Agent优化的Pony-Alpha-2模型,集成AutoGLM Browser-Use能力实现长链路自动化。架构围绕LLM(大脑)+ Agent(智能体)+ Skills(技能模板)+ MCP(万能插头)四大概念展开。

KimiClaw(月之暗面) :三层架构——K2.5模型做推理大脑 + OpenClaw负责指令执行 + ClawHub技能市场(5000+技能)。提供40GB免费云存储。

第二类:互联网大厂——生态入口争夺

QClaw(腾讯) :五层架构——交互层(微信/桌面端)、理解层(LLM多模型路由)、规划层(任务分解与编排)、执行层(5000+ Skills)、记忆层(本地持续记忆)。逻辑上分为用户交互层、理解层、规划层、执行层四层。

CoPaw(阿里) :Apache 2.0开源。核心架构模块化重构——Prompt、Hooks、Tools、Memory等组件解耦,开发者可独立替换或扩展任意模块。原生支持钉钉、飞书、QQ等。三条命令完成本地部署,兼容Ollama、DeepSeek等国产模型。

ArkClaw(字节/火山引擎) :基于Agent Mesh架构的企业多智能体治理方案。底层搭载字节自研DPU,通过硬件加速将响应延迟控制在200ms以内。

第三类:开源平替

LobsterAI(网易有道) :MIT协议,基于Electron+React+TypeScript构建。采用进程隔离架构——主进程负责窗口管理、SQLite持久化、Claude Agent SDK执行引擎、IM网关。支持本地模式或QEMU+Alpine Linux沙箱隔离运行。兼容OpenClaw的5000+技能。

五、开发者视角:技术趋势与工程启示

趋势一:架构从单体走向分层解耦。OpenClaw的Orchestrator-Gateway-Pi三层架构已成行业模板,国产方案在此基础上各自演化——StepClaw走云端推理+本地执行混合路线,miclaw走端侧原生路线。

趋势二:安全从“可选项”变成“必选项” 。CNCERT的预警、工信部的《龙虾安全养殖手册》、一连串CVE的公开,都在倒逼安全机制升级。NemoClaw的OpenShell默认拒绝(Deny-by-default)白名单网络策略代表了一种方向——零信任架构才是Agent落地的必要条件。

趋势三:技能生态从“开放”走向“可控” 。ClawHub匿名社区模式在国内企服市场大概率行不通,会被“官方审核商店”取代。从工程角度看,技能包的签名验证、沙箱隔离、行为审计,是接下来每个“xxClaw”团队必须解决的技术债。

趋势四:Token优化成为核心竞争力。miclaw通过多级提示词设计优化节省50%-90% Token开销,这正是黄仁勋在GTC 2026上所说“智能体创造的价值必须大于它消耗的算力成本”的工程落地。

写在最后

养龙虾这件事,今天看是极客玩法,明天看可能是办公标配,后天看或许就是操作系统的原生能力了。

但作为一个开发者,我的建议是:别只当“养虾人”,要当“造虾人” 。OpenClaw的源码在那里(packages/pi-embedded/runtime里的Cell Isolation机制、src/gateway/server.ts里的上下文压缩逻辑、Skills系统的热更新机制),每一行都是值得研究的工程样本。

蜕壳才刚刚开始。而每一次蜕壳,都是代码重构的机会。

目录
相关文章
|
5天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
419 125
|
8天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
703 5
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
5天前
|
缓存 人工智能 运维
阿里云618百炼大模型Qwen3.7-Max功能、免费试用、订阅计费、配置接入详解
Qwen3.7-MAX是阿里云百炼平台推出的通义千问3.7系列旗舰大语言模型,专为智能体时代复杂任务打造,依托阿里云全域算力与自研技术,在逻辑推理、长文本处理、代码工程、长周期自主执行等领域达到行业顶尖水平。2026年618期间,该模型推出多重免费试用权益、按量计费5折、订阅套餐优惠等专属福利,覆盖个人开发者、团队与企业全场景需求,以下从核心功能、免费试用、订阅计费、配置接入四方面展开详细解析。
410 123
|
3天前
|
人工智能 自然语言处理 API
阿里云Token Plan团队版解析:功能、三档套餐与省钱订阅指南
阿里云百炼平台推出的Token Plan团队版,是面向企业与团队的AI大模型订阅服务,以Credits为统一计量单位,整合文本与图像生成模型,提供团队管理、数据安全、多工具兼容等核心能力,解决团队零散订阅AI服务的管理混乱、成本失控、数据安全等痛点。本文将从核心定位、套餐详情、计费规则、团队管理、工具兼容、便宜订阅技巧等方面,全面解析Token Plan团队版,帮助企业与团队高效、低成本地使用AI服务。
304 108
|
4天前
|
存储 人工智能 数据可视化
别再手动复制 Skill 了:多 Agent 时代的 Skill 管理方案
多 Agent 场景下 Skill 的统一管理与同步。
250 125
|
18天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
12天前
|
缓存 人工智能 运维
GLM 5.2自托管全流程实战:硬件选型、vLLM/SGLang部署与成本盈亏测算
2026年智谱发布GLM 5.2超大混合专家模型,区别于以往仅开放API的闭源大模型,该模型权重以MIT开源协议对外发布,企业与开发者可完整下载、本地审计、私有化部署,实现数据不出环境、自定义微调、自主调度推理资源。GLM 5.2拥有753B总参数,原生支持百万级上下文窗口,在代码生成、长文档推理、数学逻辑等多项基准测试中对标国际顶尖商用模型,是首款可完整自托管的前沿代码向大模型。
921 0
|
13天前
|
Linux 程序员 数据格式
【2026最新】Notepad++下载、安装和使用一篇搞定(附中文版安装包)
Notepad++ 是一款免费开源、轻量高效的 Windows 文本编辑器,支持 C/Python/HTML 等 80+ 语言语法高亮、代码折叠、正则替换、编码转换及插件扩展,专为程序员与文本处理用户打造,完美替代系统记事本。(239字)