一、引言
如果你的 OpenClaw 智能体是一个黑盒,你如何知道:
- 它什么时候调用了大模型 API?
- 每次任务执行花了多长时间?
- 有没有异常错误或性能瓶颈?
- 如何优化成本?
答案就是:可观测性。
本文将手把手教你用阿里云日志服务(SLS)给 OpenClaw 装上"X 光机",让每一行代码、每一次调用都清晰可见。
二、为什么 OpenClaw 需要可观测性?
2.1 智能体运行的三大黑盒
模型调用黑盒
- 调用了哪个模型?
- Token 消耗多少?
- 响应时间多长?
任务执行黑盒
- 哪些技能被触发?
- 执行成功还是失败?
- 耗时分布如何?
资源使用黑盒
- CPU/内存使用率?
- 并发会话数多少?
- 是否存在资源泄漏?
2.2 可观测性带来的价值
- 问题快速定位:从"不知道哪里错了"到"30 秒定位根因"
- 成本优化:识别高消耗调用,优化模型选择策略
- 性能提升:发现瓶颈,针对性优化
- 安全合规:审计所有操作,满足企业合规要求

三、阿里云 SLS 核心能力介绍
3.1 什么是 SLS?
阿里云日志服务(Simple Log Service)是云原生可观测平台,提供:
- 日志采集与存储
- 实时查询与分析
- 监控告警
- 可视化仪表盘
- 链路追踪
3.2 为什么选择 SLS?
- 开箱即用:无需搭建基础设施
- 弹性伸缩:按量付费,自动扩容
- 生态集成:与阿里云产品深度集成
- 成本低廉:相比自建 ELK 栈,成本降低 50%+
四、一行命令部署 SLS 集成
4.1 前置准备
- 开通阿里云 SLS 服务
- 创建 Project 和 Logstore
- 获取访问密钥(AccessKey)
4.2 安装 SLS Agent
# 一行命令安装 SLS Logtail
curl -s https://logtail-release.oss-cn-hangzhou.aliyuncs.com/linux64/logtail.sh | bash -s install <your_project_name> <your_logstore_name>
4.3 配置 OpenClaw 日志输出
在 OpenClaw 配置文件中添加:
logging:
level: info
format: json
output:
- type: file
path: /var/log/openclaw/app.log
- type: sls
project: your-project
logstore: openclaw-logs
endpoint: cn-hangzhou.log.aliyuncs.com
accessKeyId: <your_access_key>
accessKeySecret: <your_secret>
五、核心日志采集点
5.1 模型调用日志
{
"timestamp": "2026-03-18T10:00:00Z",
"type": "model_call",
"model": "qwen3.5-plus",
"input_tokens": 1500,
"output_tokens": 300,
"latency_ms": 2300,
"cost": 0.012,
"session_id": "sess_abc123"
}
5.2 技能执行日志
{
"timestamp": "2026-03-18T10:00:05Z",
"type": "skill_execution",
"skill_name": "browser.snapshot",
"status": "success",
"duration_ms": 1500,
"session_id": "sess_abc123"
}
5.3 错误日志
{
"timestamp": "2026-03-18T10:00:10Z",
"type": "error",
"level": "error",
"message": "API rate limit exceeded",
"stack_trace": "...",
"session_id": "sess_abc123"
}
六、实战:构建可观测仪表盘
6.1 创建 SLS 仪表盘
在 SLS 控制台创建以下图表:
图表 1:模型调用趋势
* | select date_trunc('minute', __time__) as time,
count(*) as calls,
sum(json_extract_scalar(body, '$.input_tokens')) as input_tokens,
sum(json_extract_scalar(body, '$.output_tokens')) as output_tokens
where type = 'model_call'
group by time
order by time
图表 2:技能执行耗时分布
* | select json_extract_scalar(body, '$.skill_name') as skill,
approx_percentile(json_extract_scalar(body, '$.duration_ms'), 0.5) as p50,
approx_percentile(json_extract_scalar(body, '$.duration_ms'), 0.95) as p95,
approx_percentile(json_extract_scalar(body, '$.duration_ms'), 0.99) as p99
where type = 'skill_execution'
group by skill
图表 3:错误率监控
* | select date_trunc('minute', __time__) as time,
count(*) as total,
sum(case when type = 'error' then 1 else 0 end) as errors,
100.0 * sum(case when type = 'error' then 1 else 0 end) / count(*) as error_rate
group by time
order by time
6.2 配置告警规则
alerts:
- name: 高错误率告警
condition: error_rate > 5%
window: 5m
notification:
type: dingtalk
webhook: https://oapi.dingtalk.com/robot/send
- name: 高延迟告警
condition: p99_latency > 10000ms
window: 5m
notification:
type: sms
phone: 138****0000
- name: 成本异常告警
condition: hourly_cost > 100
window: 1h
notification:
type: email
to: admin@example.com
七、链路追踪:从请求到响应的全链路
7.1 Trace ID 传递
在 OpenClaw 中为每个会话生成唯一 Trace ID:
const traceId = `trace_${
Date.now()}_${
Math.random().toString(36).substr(2, 9)}`;
logger.setContext({
traceId, sessionId });
7.2 链路可视化
在 SLS 中配置链路追踪视图,可以看到:
- 用户消息接收
- 模型调用
- 技能执行
- 响应返回
完整链路,快速定位瓶颈环节。
八、成本优化实战
8.1 识别高消耗调用
* | select json_extract_scalar(body, '$.model') as model,
sum(json_extract_scalar(body, '$.cost')) as total_cost,
count(*) as call_count
where type = 'model_call'
group by model
order by total_cost desc
limit 10
8.2 优化策略
根据分析结果:
- 简单任务 → 使用
qwen3.5-flash(低成本) - 复杂推理 → 使用
qwen3.5-plus(平衡) - 代码生成 → 使用
qwen3-coder-plus(专用)
通过智能路由,可降低 40%+ 模型成本。
九、安全与合规
9.1 审计日志
所有操作记录到 SLS,满足:
- 操作可追溯
- 数据不篡改
- 合规审计要求
9.2 敏感信息脱敏
在日志采集阶段自动脱敏:
processors:
- type: mask
fields:
- api_key
- password
- token
mask_with: "***"
十、总结
通过集成阿里云 SLS,OpenClaw 智能体获得了:
✅ 全链路可观测:从用户请求到模型响应,全程透明
✅ 实时监控告警:问题早发现,早处理
✅ 成本优化依据:数据驱动决策,降低 40%+ 成本
✅ 安全合规保障:完整审计日志,满足企业要求
参考资料:
- 阿里云 SLS 官方文档:https://help.aliyun.com/product/28958.html
- OpenClaw 官方文档:https://docs.openclaw.ai
- 阿里云部署OpenClaw官网文档:https://www.aliyun.com/activity/ecs/clawdbot
- 日志服务 Logtail 配置指南