摘要
现在的对话AI经常会出现这些问题:聊久了就忘事、总是重复同一句话、重要的事情记不住、记多了又变啰嗦。
为了解决这些问题,我设计了一套完整的对话AI架构。
这套架构从空白的记忆库开始,一边聊天一边慢慢学习、记住重要的事,同时不会乱记、不会忘关键内容、不会一直重复
1 前言
现在很多聊天AI看起来很聪明,但只要聊得时间一长,问题就很明显:
- 前面说过的重要事情,转头就忘
- 上下文长度有限,装不下太多内容
- 经常抓住一个词反复说,显得很粘人
- 没有办法区分什么该记、什么不该记
- 记多了之后,回复变得又长又跑题
我在想,能不能给AI做一个更像人脑的记忆系统:
当下的事情短期处理,重要的事情长期记住,不重要的慢慢忘掉。
于是我设计了这套从空白开始、自己成长、会筛选、会保护重要信息的架构。
2 整体思路
我把AI分成两个部分:
- 短期交互部分:负责当下聊天、听懂话、回话
- 长期记忆部分:负责记住东西、管理记忆
两个部分分开工作,需要的时候再配合。
记忆一开始完全是空的,随着聊天慢慢变丰富。
3 短期交互部分(负责当下聊天)
这一部分不长期存东西,只处理当前这一轮对话。
主要解决两个问题:不重复、不粘人。
3.1 注意力自动降压
AI在聊天时,会给某些词更高的关注度。
如果某个词关注度一直特别高,AI就会一直提它,变得很粘人。
我的解决办法很简单:
- 如果某个词连续几轮关注度都太高
- 就自动降低一点它的权重
- 让AI不要一直盯着它不放
这样就不会反复复读。
3.2 高频信息抑制
如果一段话里,某个内容出现太多次,也会显得重复。
我让AI统计内容出现的次数,太多了就少提一点,让回话更自然。
4 长期记忆部分(从空白开始成长)
这是整个架构最核心的地方。
我设计了三个记忆库,一开始全部是空的:
- 核心记忆库
- 中层记忆库
- 临时缓存库
重要程度从上到下降低。
5 空白记忆库初始化
最开始的时候,三个库都是空的,什么都没有。
每个库都有容量上限,不能无限存:
- 核心记忆:少而精
- 中层记忆:中等数量
- 临时缓存:用来临时放不确定重不重要的内容
每条记忆会存这些内容:
- 具体信息
- 存进来的时间
- 重要程度权重
- 相关话题
从空白开始,一点点存。
6 信息怎么进入记忆(两层过滤)
不是什么东西都能进记忆,我设计了两层筛选。
6.1 第一层:模型自动筛选
AI在聊天时,会自动识别:
- 是不是用户独有的信息(比如喜好、经历)
- 是不是用户多次提到
- 是不是带有情绪
符合的,先放进临时缓存库。
6.2 第二层:根据用户反应确认
放进临时库之后,不会立刻当真记忆。
AI会在之后聊到相关话题时,轻轻试探一下:
- 如果你有回应、感兴趣 → 升级到中层记忆
- 如果你没反应 → 继续放临时库
- 如果你明显不在意 → 删掉
这样就不会乱记。
7 三级记忆库详细说明
7.1 核心记忆库(最重要)
存你最关键、最不能忘的信息。
一旦进来,自动上锁:
- 不会被自动删掉
- 不会被降级
- 只有你自己能删
容量很小,保证干净、快速、安全。
7.2 中层记忆库(次重要)
存比较重要、但没到核心级别的内容。
可以长期保存,但满了会淘汰最没用的。
7.3 临时缓存库(不确定重不重要)
所有新信息都从这里进。
长期没人理、不重要的,会被自动删掉。
8 记忆怎么升级、降级
- 临时缓存 → 中层:你表现出在意
- 中层 → 核心:你多次提到或特别重视,自动上锁
- 中层 → 临时:太久没提,重要度下降
- 核心 → 其他:只能你手动改,AI不能自己动
9 记忆库满了怎么办
每个库都有上限,满了就清理:
- 只清理没上锁的
- 优先删:不重要 + 很久没提的
- 上锁的核心记忆,绝对不动
这样记忆库永远不会爆炸。
10 什么时候调用记忆
不是每次聊天都翻记忆。
只有:
- 当前话题和过去某件事有关
才会去查记忆。
无关的绝不乱提,避免跑题。
11 整套系统完整运行流程
- 系统启动,三个库都是空白
- 你发消息,AI先理解当前意图
- 判断要不要调用记忆
- 生成不重复、自然的回复
- 同时把可能重要的信息放进临时库
- 之后根据你的反应,慢慢升级记忆
- 定期清理不重要的内容
- 越用越懂你,越用越稳定
12 这套架构解决了什么问题
- 不会忘记重要的事
- 不会一直重复复读
- 上下文长度不再受限
- 记忆库不会无限膨胀
- 重要信息不会被误删
- AI不会乱插话、不乱扯回忆
13 总结
我设计的这套对话AI架构,从空白记忆库开始,通过:
- 短期聊天不重复
- 三层记忆区分重要程度
- 两层过滤不乱记
- 核心记忆上锁保护
- 满了自动清理
- 需要时才调用记忆
实现了一个会成长、不乱记、不忘事、不粘人的对话AI。
整个结构轻量、稳定,普通人也能看懂和复现,适合长期陪伴型AI使用。