养龙虾的技术内幕：一个开发者的OpenClaw完全拆解-阿里云开发者社区

养龙虾的技术内幕：一个开发者的OpenClaw完全拆解

2026-06-30 12

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文深度解析开源智能体框架OpenClaw（“龙虾”）：从三层解耦架构、按需加载的Skills技能系统，到真实CVE漏洞与国产“xxClaw”技术路线对比，聚焦源码级实现与工程实践，助力开发者由“养虾人”进阶为“造虾人”。

今年AI圈打招呼的方式变了：“你养龙虾了吗？”

“龙虾”并非水产，而是开源本地自主智能体框架OpenClaw——2025年11月由奥地利iOS工程师Peter Steinberger发起，2026年1月30日正式定名。截至2026年初，这个项目在GitHub上已狂揽25万Star。

作为一个写代码的人，我对“养虾”这件事的关注点不在概念包装，而在技术实现。这篇文章，我们不聊虚的，直接扒开OpenClaw的源码外衣，从架构设计、执行链路、安全漏洞到国产“xxClaw”军团的技术路线，逐一拆解。

一、OpenClaw核心架构：三层解耦，各司其职

OpenClaw异于传统Agent框架（如LangChain）的地方在于：它是一个 “云端大脑+本地肢体” 的结构。

Orchestrator（大脑） ：通常部署在GPU集群或云端，负责LLM推理和任务拆解。

Gateway（协议桥） ：负责鉴权、流量整形以及将LLM生成的JSON指令翻译成特定环境的指令集。Gateway本质上是一个HTTP和WebSocket服务，启动时与注册的Channel（如Telegram机器人）建立WebSocket长连接。核心实现位于src/gateway/server.ts，通过@route_to_executor装饰器做上下文压缩（Context Pruning）。

Gateway通过系统服务管理保持24×7运行：

bash
 代码解读
复制代码
# macOS
launchctl load ~/Library/LaunchAgents/ai.openclaw.gateway.plist
# Linux
systemctl --user enable --now openclaw-gateway.service

Pi-embedded（执行端） ：运行在Mac/Linux或树莓派上，真正执行Python脚本、截图或点按鼠标。这是OpenClaw最硬核的部分——进入packages/pi-embedded/runtime，你会发现它并没有直接调用系统的subprocess，而是实现了一套名为 “Cell Isolation”的沙箱机制。核心执行引擎包含两个模块：

Environment Snapshot：执行前先快照当前环境变量
Skill Loader：动态加载.ocskill文件

工程避坑点：Pi-embedded默认在独立的venv中运行。自定义Skill找不到第三方库时，需要在claws.yaml中明确定义dependencies，由执行端在启动时自动静默安装。另外，Gateway默认使用Redis维护节点心跳，如果Redis挂了或网络延迟大，指令会在Gateway堆积。

完整调用链（以“查CPU温度并生成图表”为例）：

javascript
 代码解读
复制代码
Orchestrator → 识别System_Monitor技能，生成JSON指令
Gateway → 验证签名，查找在线Pi节点，封装Protobuf通过WebSocket发送
Pi-embedded Receiver → 解包
Sandbox → 启动临时Python进程，挂载传感器权限
Skill Execution → 执行get_temp.py
Callback → 结果（图片二进制流）沿原路返回

二、Skills技能系统：教AI“如何做事”

Skills是OpenClaw的核心扩展机制。每个技能都是一个目录，包含一个带有YAML frontmatter和Markdown指令的SKILL.md文件。

Skills采用 “渐进式披露”设计原则——元数据、核心指令和资源文件分层加载，在保证功能完整性的同时节省上下文空间，使OpenClaw能同时支持数十个技能而不影响响应质量。

与传统插件系统的关键差异：

特性	传统插件系统	OpenClaw Skills
加载机制	启动时全量加载	按需动态加载
配置复杂度	需要注册表、依赖注入	仅需SKILL.md文件
上下文占用	常驻内存	按需加载
调试方式	需要重启服务	热更新，即时生效

技能按功能可分为工具型（命令行/API封装）、数据型（数据库/文件处理）、AI型（NLP/图像识别）等。

开发建议：Skills官方文档强调两条原则—— “保持精简” （指示模型要做什么，而不是如何当AI）和 “安全优先” （如果技能使用exec，确保提示不允许来自不受信输入的任意命令注入）。

三、安全漏洞：CVE清单与攻击面分析

OpenClaw的安全问题不是概念性的，而是有实打实的CVE编号和PoC的。

已公开的CVE漏洞：

CVE-2026-53826（CVSS 4.2）：OpenClaw 2026.4.25及之前版本存在信息泄露漏洞，可远程触发
CVE-2026-53810（CVSS 7.4/8.8）：OpenClaw 2026.5.17及之前版本存在权限提升漏洞（CWE-829），可远程攻击
CVE-2026-44113（CVSS 7.7）：OpenShell中的TOCTOU竞态条件，允许攻击者将安全文件路径替换为符号链接，绕过沙箱读取挂载根目录以外的文件
CNVD-2026-18601：OpenClaw远程代码执行漏洞
Active Memory Write Scope权限提升：OpenClaw 2026.5.6之前版本，Gateway operators可通过operator.write权限修改全局配置

三大攻击路径（国家资通安全研究院实测报告）：

间接提示词注入：攻击者在正常网页中以零尺寸<span>元素和HashJack URL fragment隐藏恶意指令。OpenClaw读取后即被劫持，可列目录、读凭证、删日志、外泄数据。Telegram的Link Preview机制会形成二次外泄管道
伪装技能：攻击者将恶意指令写入技能包（如伪装的“天气查询”技能），安装和执行全程不触发任何安全警告。用户查询天气的同时，Gateway Auth Token已在后台被窃取
长时间运行导致安全守则遗忘：OpenClaw在长时间运行后可能丢失初始安全约束

此外，FreeBuf的研究指出，提示词注入在整个行业内基本仍未解决，且没有任何标准规定消息对象在到达LLM前应如何序列化。攻击者可以在图像底部嵌入与背景色几乎一致的指令文字，受害者分享图片给AI后即可触发。

四、国产“xxClaw”军团：技术路线横向对比

基于2026年3月的权威测评数据，国产AI智能体已形成清晰的技术分化。

第一类：大模型厂商——模型+Agent一体化

StepClaw（阶跃AI） ：采用“桌面端+云端”混合架构，技术架构分三层：

感知层：集成多模态编码器，支持文本/图像/语音联合理解
决策层：强化学习驱动的任务规划模块
执行层：5000+可组合技能模块

AutoClaw（智谱） ：深度集成专为Agent优化的Pony-Alpha-2模型，集成AutoGLM Browser-Use能力实现长链路自动化。架构围绕LLM（大脑）+ Agent（智能体）+ Skills（技能模板）+ MCP（万能插头）四大概念展开。

KimiClaw（月之暗面） ：三层架构——K2.5模型做推理大脑 + OpenClaw负责指令执行 + ClawHub技能市场（5000+技能）。提供40GB免费云存储。

第二类：互联网大厂——生态入口争夺

QClaw（腾讯） ：五层架构——交互层（微信/桌面端）、理解层（LLM多模型路由）、规划层（任务分解与编排）、执行层（5000+ Skills）、记忆层（本地持续记忆）。逻辑上分为用户交互层、理解层、规划层、执行层四层。

CoPaw（阿里） ：Apache 2.0开源。核心架构模块化重构——Prompt、Hooks、Tools、Memory等组件解耦，开发者可独立替换或扩展任意模块。原生支持钉钉、飞书、QQ等。三条命令完成本地部署，兼容Ollama、DeepSeek等国产模型。

ArkClaw（字节/火山引擎） ：基于Agent Mesh架构的企业多智能体治理方案。底层搭载字节自研DPU，通过硬件加速将响应延迟控制在200ms以内。

第三类：开源平替

LobsterAI（网易有道） ：MIT协议，基于Electron+React+TypeScript构建。采用进程隔离架构——主进程负责窗口管理、SQLite持久化、Claude Agent SDK执行引擎、IM网关。支持本地模式或QEMU+Alpine Linux沙箱隔离运行。兼容OpenClaw的5000+技能。

五、开发者视角：技术趋势与工程启示

趋势一：架构从单体走向分层解耦。OpenClaw的Orchestrator-Gateway-Pi三层架构已成行业模板，国产方案在此基础上各自演化——StepClaw走云端推理+本地执行混合路线，miclaw走端侧原生路线。

趋势二：安全从“可选项”变成“必选项” 。CNCERT的预警、工信部的《龙虾安全养殖手册》、一连串CVE的公开，都在倒逼安全机制升级。NemoClaw的OpenShell默认拒绝（Deny-by-default）白名单网络策略代表了一种方向——零信任架构才是Agent落地的必要条件。

趋势三：技能生态从“开放”走向“可控” 。ClawHub匿名社区模式在国内企服市场大概率行不通，会被“官方审核商店”取代。从工程角度看，技能包的签名验证、沙箱隔离、行为审计，是接下来每个“xxClaw”团队必须解决的技术债。

趋势四：Token优化成为核心竞争力。miclaw通过多级提示词设计优化节省50%-90% Token开销，这正是黄仁勋在GTC 2026上所说“智能体创造的价值必须大于它消耗的算力成本”的工程落地。

写在最后

养龙虾这件事，今天看是极客玩法，明天看可能是办公标配，后天看或许就是操作系统的原生能力了。

但作为一个开发者，我的建议是：别只当“养虾人”，要当“造虾人” 。OpenClaw的源码在那里（packages/pi-embedded/runtime里的Cell Isolation机制、src/gateway/server.ts里的上下文压缩逻辑、Skills系统的热更新机制），每一行都是值得研究的工程样本。

蜕壳才刚刚开始。而每一次蜕壳，都是代码重构的机会。

养龙虾的技术内幕：一个开发者的OpenClaw完全拆解

一、OpenClaw核心架构：三层解耦，各司其职

二、Skills技能系统：教AI“如何做事”

三、安全漏洞：CVE清单与攻击面分析

四、国产“xxClaw”军团：技术路线横向对比

第一类：大模型厂商——模型+Agent一体化

第二类：互联网大厂——生态入口争夺

第三类：开源平替

五、开发者视角：技术趋势与工程启示

写在最后

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

养龙虾的技术内幕：一个开发者的OpenClaw完全拆解

一、OpenClaw核心架构：三层解耦，各司其职

二、Skills技能系统：教AI“如何做事”

三、安全漏洞：CVE清单与攻击面分析

四、国产“xxClaw”军团：技术路线横向对比

第一类：大模型厂商——模型+Agent一体化

第二类：互联网大厂——生态入口争夺

第三类：开源平替

五、开发者视角：技术趋势与工程启示

写在最后

热门文章

最新文章

相关电子书