instinct:一个基于置信度的 AI Agent 自学习记忆系统

简介: instinct 是一款开源 AI 编程记忆系统,让 Claude Code、Cursor 等 MCP Agent 具备跨会话自学习能力。通过“观察→重复→成熟→建议”机制,自动累积模式置信度,智能晋升为可建议(mature)或自动执行(rule)的惯例,无需人工维护规则文件。基于 SQLite 与 MCP 标准,支持项目级作用域与自动衰减,真正实现 Agent 的习惯养成。

Claude Code、Cursor、GitHub Copilot 这类 AI 编码 Agent 在单次会话中表现出色,但每次新会话都从零开始。没有连续性,也没有"上次遇到过类似情况"的判断力。

现有的应对方式是CLAUDE.md 文件、系统提示词、手动编写的规则列表,这些本质上都是把人当作记忆载体。人去观察模式、记录下来、维护文件,Agent 只负责执行。

其实记忆应当是 Agent 在反复实践中习得的,而非人工分配的。

核心思想:基于置信度的学习

多数 AI Agent 记忆系统采用显式建模,即人写规则、Agent 遵照执行。instinct 走了一条不同的路,借鉴了大脑中习惯形成的机制:

观察 → 重复 → 成熟 → 建议

Agent 首次执行某个操作时,instinct 将其记录为一条 raw 观察,初始置信度为 1。同一模式再次出现,置信度递增。当置信度突破第一个阈值,模式进入 mature 状态,就出现在建议列表中;如果获得了更高的阈值,模式晋升为 rule,可以自动应用。

 Confidence 1-4:   raw      (observed, not actionable)
 Confidence 5-9:   mature   (ready to suggest)
 Confidence 10+:   rule     (strong enough to auto-apply)

什么时候一个模式算"准备好了"?没有人来做判断,数据说了算。

工作原理

1、观察

每当发现一个反复出现的模式——一组工具调用序列、某种编码偏好、一类频繁出现的修复——就将其记录下来:

 instinct observe "seq:lint->fix->test"
 instinct observe "pref:style=black" --cat preference
 instinct observe "fix:missing-import" --cat fix_pattern

命名约定通过前缀区分模式类别:

 seq:   → Action sequence     (e.g. seq:lint->fix->lint)
 pref:  → User preference     (e.g. pref:stdlib-first)
 fix:   → Recurring fix       (e.g. fix:missing-import)
 combo: → Tools used together (e.g. combo:pytest+coverage)

每次观察都是一个 upsert 操作:模式已存在则置信度加 1,不存在则以置信度 1 新建。

2、合并

会话结束时(或定期),运行 consolidate 触发自动晋升:

 instinct consolidate
 # Promoted to mature: 3
 # Promoted to rule: 1
 # Total instincts: 12

学习在这一步完成。累积观察次数达标的模式自动晋升,不需要人介入。

3、建议

下一次会话开启时,Agent 向系统请求建议:

 instinct suggest
 #   seq:test->fix->test    conf=8  [mature]  sequence
 #   pref:stdlib-first      conf=12 [rule]    preference
 # 2 suggestions

只有 mature 和 rule 级别的模式会返回。Raw 观察始终保持静默,直到置信度积累到位。

架构

这三个组件不需要外部依赖(MCP SDK 除外),而且SQLite 也内置于 Python 标准库;MCP 服务器基于 FastMCP 实现。

为什么选择 SQLite?

备选方案评估过 JSON 文件、Redis、简单的键值存储。而SQLite原因有四:可用 SQL 按置信度、类别、项目任意查询;ACID 事务保证状态一致性;无需守护进程、无需额外配置,整个存储就是一个文件;迁移学习历史只需复制这个文件。

核心的 upsert 查询把创建和更新合并到了一条语句里:

 INSERT INTO instincts (pattern, category, confidence, ...)
 VALUES (?, ?, 1, ...)
 ON CONFLICT(pattern) DO UPDATE SET
     confidence = confidence + 1,
     last_seen = excluded.last_seen

首次观察建行,重复观察加分。一条查询就搞定了

为什么选择 MCP?

Model Context Protocol 是一个将 AI Agent 与外部工具连接的开放标准。instinct 实现为 MCP 服务器后,天然兼容所有支持该协议的 Agent——Claude Code、Cursor、Goose,或任何其他 MCP 客户端。

 {
   "mcpServers": {
     "instinct": {
       "command": "instinct",
       "args": ["serve"]
     }
   }
 }

配置文件里加上这几行,任意 MCP Agent 即可接入自学习记忆。

项目感知的学习

并非所有模式都具有普适性。"用 black 格式化"也许适用于某个项目,换一个项目就不适用了。所以instinct 用项目指纹来划定作用域:

 def project_fingerprint(path=None):
     p = Path(path or Path.cwd()).resolve()
     return hashlib.sha256(str(p).encode()).hexdigest()[:12]

每个项目依据其目录路径生成一个稳定的 12 字符 SHA256 指纹。模式分为两类:项目级模式仅在对应项目中生效;全局模式(project 字段为空)在所有项目中可见。

Agent 调用

suggest

时,返回结果同时包含全局模式和当前项目的专属模式。Python 项目的格式化偏好不会渗透到 Go 项目中。

衰减:遗忘过时的模式

人的习惯长期不用会逐渐淡化,instinct 中的模式也遵循同样的逻辑。

 instinct decay --days 90

超过 90 天未被观察到的模式,置信度减 1。减到零的模式自动删除。系统以此避免积累过时的建议,保持记忆库的时效性。

实际使用

以下是与 Claude Code 集成的典型场景。在 MCP 服务器的指令中,instinct 对 Agent 说:

Use 'observe' to record patterns you notice. Use 'suggest' to get mature patterns that should guide your behavior. Run 'consolidate' periodically to auto-promote high-confidence patterns.

几次会话之后,Agent 开始形成自己的操作手册:

 seq:test->fix->test          conf=8   [mature]   — Always re-run tests after fixes
 pref:stdlib-first            conf=12  [rule]     — Prefer stdlib over third-party
 fix:missing-init             conf=6   [mature]   — Check for __init__.py in new packages
 combo:pytest+coverage        conf=5   [mature]   — Always run coverage with tests

没有人显式地教过 Agent 这些内容——它从跨会话的重复行为中自行归纳出来。到第五次会话,Agent 对工作流的熟悉程度已经超过一个新加入的团队成员。

深入底层:数据库 Schema

完整的 SQLite schema 如下:

 CREATE TABLE instincts (
    pattern    TEXT PRIMARY KEY,
    category   TEXT NOT NULL DEFAULT 'sequence',
    confidence INTEGER NOT NULL DEFAULT 1,
    first_seen TEXT NOT NULL,
    last_seen  TEXT NOT NULL,
    source     TEXT NOT NULL DEFAULT '',
    project    TEXT NOT NULL DEFAULT '',
    promoted   INTEGER NOT NULL DEFAULT 0,
    metadata   TEXT NOT NULL DEFAULT '{}'
 )

一张表,构成完整的数据模型。

promoted

字段对应成熟度等级:0 = raw,1 = mature,2 = rule。

metadata

列存储任意 JSON,用于在不做 schema 迁移的前提下扩展功能。

Python API

CLI 和 MCP 服务器之外,instinct 也提供了 Python API:

 from instinct.store import InstinctStore

store = InstinctStore()  # 默认: ~/.instinct/instinct.db

# 观察模式
store.observe("seq:test->fix->test", source="claude-code")
store.observe("seq:test->fix->test")  # 置信度现在 = 2

# 查询
suggestions = store.suggest()           # 获取成熟模式
store.list(min_confidence=3)            # 按置信度筛选
store.search("test")                    # 全文搜索

# 生命周期
store.consolidate()                     # 自动提升
store.decay(days_inactive=90)           # 减少过时模式
stats = store.stats()                   # 汇总统计

# 导出
rules = store.export_rules()            # 仅置信度 >= 10

 store.close()

借助该 API,instinct 可以方便地嵌入自定义工具链、CI 流水线或数据分析面板。

本地测试

 pip install instinct-mcp
 # 记录你的第一个模式
 instinct observe "seq:your->first->pattern"
 # 查看系统学到了什么
 instinct suggest

 # 启动 MCP 服务器用于 Agent 集成
 instinct serve

代码完全开源,包已发布在 PyPI 上。

https://avoid.overfit.cn/post/b984b1a13b714722939e02f80affc95a

by Yakuphan Yucel

目录
相关文章
|
13天前
|
弹性计算 人工智能 机器人
阿里云ECS/轻量服务器+本地全平台部署OpenClaw|集成QQ机器人+千问Qwen3.6-Plus+Coding Plan大模型配置保姆级教程
2026年,开源AI自动化框架OpenClaw(曾用名Clawdbot)已成为个人与团队效率提升的核心工具,凭借“行动式AI”能力,可将自然语言指令转化为文件管理、系统控制、数据处理、社交交互等实际任务执行。本文完整覆盖2026年阿里云轻量服务器部署及本地MacOS/Linux/Windows11部署OpenClaw(Clawdbot)步骤流程及阿里云千问Qwen3.6-Plus配置或市场上免费大模型Coding Plan API配置及常见问题解答,同步新增阿里云ECS云服务器专业部署、QQ机器人全流程集成方案,所有操作附可直接复制的代码命令、可视化指引与高频问题排查方案。
209 14
|
22天前
|
机器学习/深度学习 算法 搜索推荐
RouteRAG:用特殊 Token 和强化学习构建可学习的 RAG 检索策略
RouteRAG将多轮RAG建模为序列决策过程,模型自主学习何时检索、搜什么、用哪种模式(段落/图/混合),并通过两阶段GRPO强化学习,兼顾答案准确率与检索效率,在多跳问答上显著提升性能。
137 12
RouteRAG:用特殊 Token 和强化学习构建可学习的 RAG 检索策略
|
22天前
|
人工智能 弹性计算 数据可视化
部署OpenClaw有哪些成本?附OpenClaw低成本部署指南
OpenClaw(“养龙虾”)是一款开源AI代理框架,可自动化文件处理、工作流与消息管理。本文详解其部署成本:软件免费,云服务器低至68元/年,阿里云百炼新用户享7000万Token免费额度,并提供一键图形化部署指南。
631 32
|
15天前
|
人工智能 数据可视化 机器人
OpenClaw一键部署攻略,手把手教你 “养龙虾”!
还在为部署OpenClaw踩坑发愁?“养龙虾”其实超简单!本文奉上阿里云一键云端部署攻略:全程可视化、零代码,仅两步——买预装服务器+填API密钥,5分钟即可拥有专属AI数字员工!支持微信/钉钉协同、文件处理、日程管理、代码辅助等,新手友好,成本低廉(新用户首月9.9元+7000万Token免费额度)。
376 26
|
27天前
|
机器学习/深度学习 人工智能 缓存
Alibaba Cloud Linux 4 LTS 64位 Deb 版是什么系统镜像?兼容Debian和Ubuntu吗?
Alibaba Cloud Linux 4 LTS 64位Deb版是阿里云首个兼容Debian生态的LTS系统,深度适配Ubuntu 24.04,专为AI/深度学习优化。预装KeenTune智能调优框架、AI加速内核及kmod-fuse,支持百万IOPS与40GB/s缓存带宽,提供2025–2038年长期支持。(239字)
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
大模型应用:轻量化视觉语言模型(VLM):基于Qwen2-VL多模态模型实践.87
超紧凑视觉语言模型(如Qwen2-VL-2B)以仅20亿参数、约4GB体积,实现本地化图文理解与生成,支持CPU/入门GPU实时推理,兼顾精度与轻量部署,推动多模态AI走向终端、离线与普惠应用。
115 2
|
10天前
|
机器学习/深度学习 搜索推荐 算法
拆解推荐系统:候选生成、过滤、排序、多样性的分层设计
推荐系统是端到端流水线,非单一算法:涵盖候选生成、过滤、特征工程、多目标排序、多样性调控与反馈闭环。强调关注点分离,以保障质量、速度与行为可控。动手前须明确定义Item、用户行为及成功指标。
195 12
拆解推荐系统:候选生成、过滤、排序、多样性的分层设计
|
13天前
|
人工智能 Linux API
阿里云轻量服务器部署OpenClaw与千问Qwen3.6-Plus全流程实战:从环境搭建到模型接入及避坑指南
OpenClaw(原Clawdbot)作为2026年主流的开源AI智能体框架,凭借轻量化、跨平台、可自托管、多IM集成与大模型灵活对接的特性,成为个人与团队搭建专属AI助手的首选方案。本文聚焦阿里云轻量服务器部署OpenClaw的最简流程,覆盖本地MacOS/Linux/Windows11全平台部署方法,详解阿里云千问Qwen3.6-Plus高性能API配置、飞书即时通讯集成步骤,并整理全场景高频问题与避坑方案,所有命令可直接复制运行,零基础用户可按步骤一次部署成功。
628 17
|
13天前
|
人工智能 缓存 JavaScript
🚀 2026年国内 Codex 安装教程和使用教程:GPT-5.4 完整指南(新手也能10分钟上手)
2026年,AI编程迈入“自动干活时代”:GPT-5.4+Codex让AI成为可执行工程任务的“数字工程师”。本文带你零基础掌握国内可用的Codex CLI安装、GPT-5.4接入、命令行实战与高阶自动化工作流,告别传统Copilot,升级为AI产线搭建者。(239字)
3426 17
|
4天前
|
人工智能 安全 API
Hermes Agent 部署踩坑无数?阿里云一站式落地教程,全程10分钟
继OpenClaw爆火后,Nous Research推出的Hermes Agent成为开源Agent新顶流:自进化闭环学习、跨会话持久记忆、支持Telegram/WhatsApp/钉钉等15+平台,开箱即用。
185 15