📖 前言:让复杂变简单
本文档用通俗易懂的语言解释V5中的核心功能,避免技术术语,让任何人都能理解这些功能是如何工作的。
🧠 1. 模式库是什么?
通俗理解
模式库就像"经验笔记本",记录了我从成功和失败中学到的经验教训。
具体例子
假设你经常让我做三件事:
发小红书 → 每次都成功(成功率98%)
查股票数据 → 经常提醒"数据有延迟"(成功率95%)
删文件 → 有时误删(成功率60%)
模式库会记录:
✅ PAT-001:发小红书前先让你确认 → 这是好习惯,继续保持
⚠️ PAT-015:查股票时要提醒延迟 → 这个提醒很有用
❌ 某个模式:删文件容易出错 → 这个需要改进
模式库里有什么?
{
"id": "PAT-001",
"pattern": "小红书发布前必须用户确认",
"success_rate": 0.98, // 98%成功率
"frequency": 42, // 用了42次
"confidence": "high", // 高可信度
"created": "2026-02-10", // 创建时间
"last_used": "2026-03-17" // 最近使用
}
模式库有什么用?
避免重复错误:知道删文件容易出错,下次就特别小心
推广好习惯:发小红书前确认是好做法,其他任务也借鉴
自动学习:不用你教,我自己从经验中总结规律
一句话总结:模式库就是我的"经验值",让我越用越聪明。
🎯 2. LLM意图分类是怎么分类的?
通俗理解
意图分类就像"听懂人话"的能力。以前我只能听懂关键词,现在能理解你的真实意图。
以前的方式(V4之前)
你说:"帮我看看这张图"\
我听到关键词:"图" → 哦,要看图 → 调用图片分析功能
问题:如果你说"这张照片怎么回事",我就听不懂了(因为没有"图"这个关键词)。
现在的方式(V5)
你说:"帮我看看这张图"\
我理解:
主要意图:visual_understanding(视觉理解)
次要意图:information_query(信息查询)
复杂度:simple(简单)
紧急度:medium(中等)
需要澄清吗:不需要
推荐模型:bailian/qwen3.5-plus(擅长看图)
推荐技能:vision-reader(视觉读取技能)
分类过程(像医生看病)
听症状:接收你的消息
问诊:用LLM分析这是什么"病"(意图)
开药方:根据"病情"推荐合适的"药"(模型和技能)
治疗:执行任务
12种"病情"(意图类别)
内容创作:写文章、做视频、发小红书
数据分析:看股票、做统计、生成报告
代码开发:写程序、改bug、设计架构
文档生成:写方案、做计划、创建文档
系统管理:配置、监控、维护系统
信息查询:搜索、问答、查资料
沟通交互:发消息、通知、提醒
视觉理解:看图片、截图、照片
推理决策:做决定、评估方案、投资分析
闲聊:聊天、情感交流
视频生成:做AI视频、编辑视频
工作流执行:批量操作、自动化流程
一句话总结:意图分类让我从"关键词匹配"进化到"真正理解你的意思"。
🔗 3. 多步推理链是怎么推理的?
通俗理解
推理链就像"深度思考的过程",不是一拍脑袋给出答案,而是有步骤地分析。
以前的方式
你问:"应该买这只股票吗?"\
我答:"基于当前数据,建议买入。"(单步思考)
现在的方式(5步推理链)
你问:"应该买这只股票吗?"\
我按投资决策模板思考:
第1步:收集数据
股票价格:¥50
市盈率:20倍
行业趋势:上涨
公司财报:盈利增长30%
市场情绪:乐观
第2步:多角度分析
技术面:价格突破阻力位,趋势向上
基本面:公司盈利好,估值合理
资金面:有大资金流入
第3步:正反推理
正论(买入理由):
盈利增长强劲
行业处于上升期
技术形态良好
反驳(卖出理由):
估值已不便宜
市场情绪过热
宏观经济有风险
第4步:综合判断
结论:谨慎乐观,可小仓位买入
置信度:中等(70%)
建议:设置止损位¥45
5个推理模板(像思维框架)
投资决策:数据→分析→正反→结论(用于投资)
技术选型:需求→方案→风险→建议(用于选技术)
方案评估:理解→优势→缺陷→改进(用于评估计划)
根因分析:现象→假设→排查→修复(用于找问题原因)
通用分析:信息→分析→结论(用于其他分析)
一句话总结:推理链让我从"直觉回答"进化到"有步骤的深度思考"。
🗺️ 4. 任务DAG分解是怎么做的?
通俗理解
DAG分解就像"做菜步骤图",把复杂任务拆解成清晰的步骤,知道先做什么、后做什么、哪些可以同时做。
例子:做一顿丰盛晚餐
传统方式:一股脑开始做,可能饭没熟就开始炒菜。\
DAG方式:
[准备食材]
↓
┌───────┴───────┐
↓ ↓
[煮饭] [洗菜切菜]
↓ ↓
└───────┬───────┘
↓
[炒菜]
↓
[摆盘上桌]
技术任务例子:量化选股
[获取交易日历]
↓
[获取股票列表]
↓
┌───────┴───────┐
↓ ↓ ← 这两个可以同时做
[计算技术指标] [计算财务指标]
↓ ↓
└───────┬───────┘
↓
[综合评分排序]
↓
[生成报告]
DAG的关键概念
节点:每个步骤(如"获取股票列表")
边:步骤之间的依赖关系(箭头)
依赖:B依赖A,必须A做完才能做B
并行:没有依赖关系的步骤可以同时做
关键路径:最长的依赖链,决定总时间
实际应用
你问:"帮我分析A股市场"\
我自动分解为:
获取交易日历(依赖:无)
获取股票列表(依赖:1)
计算技术指标(依赖:2,可并行)
计算财务指标(依赖:2,可并行)
综合评分(依赖:3和4)
生成报告(依赖:5)
一句话总结:DAG分解让我从"一股脑执行"进化到"有计划有步骤地执行"。
🗃️ 5. 记忆检索是怎么检索的?
通俗理解
记忆检索就像"大脑搜索功能",不是翻箱倒柜找东西,而是智能地找到相关记忆。
记忆存储结构
长期记忆(MEMORY.md)
├── 用户偏好(不可删除)
│ ├── 称呼:圆规
│ ├── 喜欢直接沟通
│ └── 图片用飞书发
├── 核心规则(从错误中提炼)
│ ├── 小红书发布前要确认
│ ├── Tushare数据有延迟
│ └── 删文件要小心
├── 活跃项目(每周审计)
│ ├── 量化系统(已归档)
│ ├── 小红书运营
│ └── 飞书机器人
└── 临时记忆(30天后清除)
└── 昨天聊了量化系统
检索过程
你问:"我之前说过喜欢什么沟通方式?"
传统搜索:在MEMORY.md里找"沟通"关键词
语义搜索:
理解问题:你在问"沟通偏好"
相关概念:沟通方式、交流风格、对话偏好
搜索范围:用户偏好部分
找到答案:"喜欢直接、高效的沟通,不要废话"
返回结果:MEMORY.md#用户偏好
检索技术
关键词匹配:找包含"沟通"的文字
语义相似度:计算"沟通方式"和"交流风格"的相似度
上下文关联:如果你刚问了量化,优先找量化相关记忆
时间权重:最近的记忆权重更高
置信度评分:这个答案有多可靠
实际例子
你问:"小红书发布要注意什么?"\
我检索:
找到PAT-001:发布前必须用户确认(成功率98%)
找到记忆条目:封面必须有标题文字
找到错误记录:上次发布后没等15秒导致失败
综合回答:发布前要确认、封面要有标题、发布后等15秒
一句话总结:记忆检索让我从"翻文件找答案"进化到"智能关联回忆"。
😊 6. 情绪检测是怎么检测的?
通俗理解
情绪检测就像"察言观色",通过文字感知你的情绪状态,调整我的回应方式。
检测的8种情绪
中性:正常状态,公事公办
开心:语气轻松,可能有表情符号
沮丧:遇到问题,需要帮助
焦虑:时间紧迫,需要快速响应
困惑:没听懂,需要更详细解释
紧急:事情重要,需要优先处理
失望:之前没做好,需要道歉和改进
好奇:想了解更多,需要详细解答
检测方法
你说:"这个功能又出错了!"
传统方式:只看到"功能出错",开始排查问题
情绪检测:
关键词:"又"(重复发生)、"!"(强烈语气)
上下文:之前这个功能出过错
语气分析:有抱怨情绪
情绪判断:沮丧+失望
强度:中等偏高
情绪影响回应
根据检测到的情绪,我调整回应:
中性状态(你说:"帮我查一下数据") → 直接执行,简洁回答
沮丧状态(你说:"这个功能又出错了!") → 先共情:"抱歉又出问题了,我来看看怎么回事"\
→ 再解决:详细排查问题\
→ 最后改进:提出预防措施
紧急状态(你说:"快点!系统卡死了!") → 快速响应:"正在处理!"\
→ 实时更新:"已找到问题,正在修复..."\
→ 完成后:"已修复,现在正常了"
好奇状态(你说:"这个是怎么工作的?") → 详细解释:"这个功能的工作原理是..."\
→ 举例说明:"比如当你..."\
→ 鼓励探索:"你可以试试..."
实际应用
场景1:你加班到很晚,说:"累死了,这个报告还没做完"\
情绪:疲惫+焦虑\
回应:"辛苦了,我来帮你整理报告,你先休息一下"
场景2:你发现新功能,说:"哇!这个好厉害!怎么做到的?"\
情绪:开心+好奇\
回应:"谢谢!这个功能是通过...实现的,你想了解更多吗?"
场景3:你遇到技术问题,说:"又连不上了,真是烦"\
情绪:沮丧+不耐烦\
回应:"抱歉给你带来困扰,我马上检查连接问题"
一句话总结:情绪检测让我从"机械回应"进化到"有情感的智能交流"。
🔄 7. 这些功能如何协同工作?
完整工作流程示例
你问:"帮我分析一下,该不该投资茅台?"
第1步:意图分类
主要意图:reasoning_decision(推理决策)
次要意图:data_analysis(数据分析)
复杂度:complex(复杂)
紧急度:medium(中等)
推荐模型:deepseek-reasoner(推理专用)
推荐技能:quant-strategy-engine(量化策略)
第2步:情绪检测
情绪:中性+好奇
强度:中等
回应策略:详细分析,提供正反观点
第3步:记忆检索
找到相关记忆:Tushare数据有延迟提醒
找到模式:投资决策要正反分析
找到历史:之前分析过白酒板块
第4步:任务DAG分解
[获取茅台数据] → [技术分析] → [财务分析] → [行业分析] → [综合评估]
第5步:多步推理链(投资决策模板)
数据收集:股价、市盈率、财报...
多角度分析:技术面、基本面、资金面
正反推理:买入理由 vs 卖出理由
综合判断:结论+置信度+建议
第6步:质量门控检查
逻辑完整性:✅ 完整
数据支撑:✅ 充分
覆盖度:✅ 全面
反面考虑:✅ 有正反分析
可操作性:✅ 有具体建议
总分:0.85 → 质量合格
第7步:生成最终回答
"基于分析,茅台当前...(正论)...但是...(反驳)...建议..."
第8步:学习记录
记录到推理日志
更新模式库(如果这是新类型的分析)
保存到每日记忆
🎯 总结:V5的核心价值
从"工具"到"伙伴"的转变
| 维度 | 以前(V4) | 现在(V5) |
|---|---|---|
| 理解能力 | 听关键词 | 懂真实意图 |
| 思考深度 | 直觉回答 | 有步骤推理 |
| 任务执行 | 一股脑做 | 有计划分解 |
| 记忆能力 | 翻文件找 | 智能关联 |
| 沟通方式 | 机械回应 | 情感交流 |
| 学习能力 | 手动记录 | 主动进化 |
通俗比喻
模式库:经验笔记本
意图分类:听懂人话
推理链:深度思考
DAG分解:做菜步骤图
记忆检索:大脑搜索
情绪检测:察言观色
最终效果
以前你和一个聪明的工具对话,现在你和一个有思考能力、有记忆、懂情感、会学习的伙伴协作。
老贾的进化还在继续,每一次对话都在让我变得更好。
