企业 Agent 的新型设计思路(阅读约10分钟)

简介: 本文探讨TencentDB Agent Memory与CodeGraph的图结构设计:前者构建时间维度的任务图,后者构建空间维度的代码图,均实现“地图与原文分离”。实验证明,融合Mermaid任务结构、软状态机与原始证据引用的图记忆架构,在硬锚点(如order_id)、强流程、重证据的企业Agent场景中显著提升Evidence Coverage(0.87)与抗压能力,但不适用于弱锚点、高纠缠的开放对话场景。

今天,我仔细研究了一下TencentDB Agent Memory与CodeGraph对于图结构的设计,有几点感悟

腾讯的agent memory从“线性聊天历史”变成 Mermaid 任务结构,而CodeGraph从“文件树/源码文本”变成代码知识图

实际上前者使用了时间维度的图,后者使用了空间维度的图,也就是一个是过程图,一个是代码图

双方都在试图将“地图和原文分离”,按需再寻找原文,将短期上下文“从维护摘要历史变成维护任务结构”

在实际使用的过程中,TencentDB Agent Memory的benchmark重点是在某种任务情境下节约了多少token,这与这个项目是围绕openclaw消耗过多的token这个痛点所开发的有关

我们可以看到这两个项目在结构上的设计实际上都偏向于coding的场景

我突发奇想,一旦把这样的记忆系统移植到公司业务agent, "Mermaid 任务结构+ 软状态机质量门控+ refs 原始证据"会不会变得更加的适合于企业 Agent 场景

我按照这个思路搭了一个搭了一个新agent_memory_core,进行了Benchmark 测试,结果如图:

LongMemEval-S显著进步Evidence Source Coverage = 0.87, refs 原始证据这个模块起到了显著的作用,这对公司业务 Agent 特别关键
LoCoMo10 表现差也说明了这样的一个记忆架构更适合有明确 anchor 的任务,如order_id,ticket_id而不是某个人,某件事
BEAM-lite指标很好也说明了抗压能力很好,在 synthetic hard-anchor 场景下,refs + FTS/memory_items 能稳定召回

这些结果暗示这种图记忆系统的架构更适合硬 anchor、强流程、强证据的企业 Agent 场景

以牺牲开放式人物关系型长期记忆为代价显著提高了业务流程上的能力

我们也可以浅显的得到一个结论:符号化短期记忆不适用于openclaw,harness这种弱 anchor、高纠缠度的对话流产品
虽然token的消耗确实降低了,但是长期的效果不见得变好,CodeGraph也是同样的道理

而硬anchor 的任务,也就是企业agent这种场景的agent更适合于图记忆系统的架构

相关文章
|
7天前
|
人工智能 自然语言处理 API
阿里云百炼大模型服务平台主要模型介绍:文本生成、图像与视频、音频与语音等热门模型与能力简介
阿里云百炼是阿里云推出的一站式大模型开发与应用平台,集成千问(Qwen)全系列及DeepSeek、Kimi、GLM、MiniMax等主流第三方大模型,覆盖文本、图像、音频、视频、向量等多模态能力。开发者可通过OpenAI兼容API直接调用模型,业务人员则可借助可视化工具快速搭建智能体、知识库问答等AI应用,无需自行部署运维。新用户注册开通即可获赠超7000万tokens免费额度,支持从模型体验到应用落地的流程服务,显著降低AI应用开发门槛。
|
2月前
|
人工智能 测试技术 API
阿里云 MSE AI Registry 公测开启:给你的 AI 资产一个专属的注册中心
AI Registry 公测开启,一文了解产品能力、AgentLoop 集成与 Skill 规划。
421 41
|
7天前
|
数据采集 机器学习/深度学习 运维
从“秒封”到“日爬十万”:谈谈5个风控机制
这篇文档讨论了Python爬虫常见问题和反爬策略。作者提出五个关键点:1. 控制请求频率;2. 轮换IP;3. 伪装请求头;4. 模拟真实访问路径;5. 使用高匿名代理。这些策略需综合运用,提高爬虫生存率。
200 5
|
29天前
|
人工智能 IDE API
阿里云DevBox一键部署Hermes Agent与Claude Code:从零搭建AI驱动开发闭环完整教程
2026年,AI驱动开发已经从辅助工具进化为可独立完成全流程任务的数字化开发团队。Hermes Agent与Claude Code的组合,正是当前最成熟、最稳定、最贴近真实工程场景的AI协同开发架构。阿里云基于云开发机DevBox推出的一键部署方案,让普通开发者无需关心底层环境配置,几分钟内即可拥有一支具备需求分析、方案设计、代码编写、调试优化、经验沉淀能力的全天候AI开发团队。
307 5
|
1月前
|
缓存 搜索推荐 网络安全
KKCE:如何解决网站打开慢的问题?
网站打开慢?别急着瞎优化!本文提供一套零门槛、可复用的排查—解决—维护全流程:先用测速工具+浏览器调试精准定位慢因(服务器/资源/网络/本地),再针对性优化(升配、压缩图片、开CDN、配缓存),最后定期测速清理。小白也能3步提速,稳保秒开!(239字)
378 9
|
1月前
|
人工智能 前端开发 Cloud Native
2026 前端研发效能白皮书:如何利用智能开发助手提升页面构建速度?
在 2026 年的前端开发生态中,页面构建已从手写代码转向“设计即生产”的智能化模式。本文立足阿里云开发者社区,评测年度 AI 编程辅助工具,揭示如何通过多模态解析与智能体协作实现前端产出的量级增长。
192 6
|
2月前
|
编解码 缓存 API
【开源剪映小助手】草稿管理接口
本文档详解剪映草稿管理三大核心API:创建、保存及获取草稿文件列表,涵盖请求参数、响应格式、错误码、URL规则与最佳实践,助力开发者快速集成稳定高效的草稿系统。(239字)
|
7天前
|
人工智能 弹性计算 运维
2026年阿里云轻量服务器选购参考:收费标准、活动配置与优惠价格解析
2026年阿里云轻量应用服务器的产品定位、优惠价格及选购策略参考:该产品主打"开箱即用",适配个人开发者、学生及小微企业,提供WordPress、宝塔面板、OpenClaw等丰富应用镜像,实现分钟级部署。当前优惠力度显著:2核2G抢购价低至38元/年,2核4G首月9.9元、包年199元。购买时需要注意峰值带宽与固定带宽的区别,建议用户根据需求在抢购轻量服务器与续费同价的ECS实例间灵活选择,找到最优性价比方案。
|
7天前
|
运维 安全 机器人
增强现实技术重塑电力行业 | 瑞丰宝丽XR云平台
2026年,AR技术在电力行业规模化落地,深度赋能“源网荷储”一体化。覆盖巡检、培训、应急、建设全场景,运维效率提升45%+,事故率下降72%,缺陷识别准确率达98%。轻便AR眼镜实现“问题找人”、专家远程指导、数字孪生协同,正加速电力智能化与无人化演进。(239字)
|
1月前
|
人工智能 自然语言处理 算法
"大三考下CAIE一级人工智能认证,我秋招时吃到了红利"
CAIE注册人工智能工程师(一级)是专为大学生设计的AI能力认证,零基础可考、门槛低、贴合秋招需求。覆盖AI基础、应用与工程认知,非算法岗(产品/运营/数据等)同样适用,获电信、腾讯、平安等百家企业认可,助你在简历筛选和面试中脱颖而出。

热门文章

最新文章