【AI Agent系列】【MetaGPT多智能体学习】1. 再理解 AI Agent - 经典案例和热门框架综述

简介: 【AI Agent系列】【MetaGPT多智能体学习】1. 再理解 AI Agent - 经典案例和热门框架综述

本系列文章跟随《MetaGPT多智能体课程》(https://github.com/datawhalechina/hugging-multi-agent),深入理解并实践多智能体系统的开发。

本文为该课程的第二章(智能体综述及多智能体框架介绍)笔记)。

0. 温故而知新 - 再看 AI Agent 是什么

前面文章已经介绍过我理解的 AI Agent 的概念。

  • 智能体就是像人一样,能理解现实中的事务,有记忆,会思考,会总结,会学习,像人一样会规划,会决策,会使用各种工具来完成某项任务。
  • 多智能体,就像一个团队,大了说像我们现在生活的社会,每个智能体有自己的职能和领域,人与人之间通过协作,能完成更加复杂和庞大的目标。

再看这张经典的图:

现在看来,中间的Agent应该换为LLM更为合适,而整张图才能叫做Agent。也就是说:Agent是上图中所有能力的集合,以LLM为大脑,来决定完成任务所需的步骤,规划执行该使用哪些工具,该得到什么结果。再辅以记忆能力,让整个过程像人一样能够自主决策,自主行动以自主达到目的。

1. 一个AI Agent实例介绍 - BabyAGI

项目地址:https://github.com/yoheinakajima/babyagi/blob/main/README.md

其运行流程如下

(1)从任务列表中提取第一个任务

(2)将任务发送到执行代理(Execution Agent),该Agent使用LLM根据上下文完成任务。

(3)丰富结果并将其存储在向量数据库

(4)创建新任务,并根据上一任务的目标和结果重新确定任务列表的优先级。

(5)重复以上步骤

其中涉及四个Agent,其中前三个Agent都利用了大模型的能力来进行任务规划和总结

  • Execution Agent 接收目标和任务,调用大模型 LLM来生成任务结果。
  • Task Creation Agent 使用大模型LLM 根据目标和前一个任务的结果创建新任务。它的输入是:目标,前一个任务的结果,任务描述和当前任务列表。
  • Prioritization Agent 使用大模型LLM对任务列表进行重新排序。它接受一个参数:当前任务的 ID
  • Context Agent 使用向量存储和检索任务结果以获取上下文。

运行起来后的过程可以参考这篇文章:babyagi: 人工智能任务管理系统

2. 多智能体框架比较

对市面上多智能体框架了解的不多,目前为止,只用过 MetaGPT、AutoGPT,听过AutoGen。想了解更多的,可以参考这篇文章 基于大语言模型的AI Agents—Part 3,里面总结比较了常见的多智能体框架:

这里我只对MetaGPT和AutoGPT的使用感受做下比较和说明,自己的感受,个人观点,欢迎批评指正。

  • AutoGPT更多的是依赖大模型去进行规划和行动,个人感觉有点过于依赖大模型的能力了。而目前而言,大模型的能力还远没有达到能自主规划和决策行动的地步,这使得AutoGPT的执行结果非常地不可控,很难达到自己想要的效果。并且其是单智能体,能完成的工作相对比较简单。接口也不太好用。
  • MetaGPT更多的是依赖事先定义好的SOP(标准作业流程),这使得任务的执行过程变得相对可控,最大限度的保证任务的正确执行。并且可以是多智能体,能执行的任务相对复杂。接口封装也比较清晰。尤其是Team、Role和Action三个抽象,真的将Agent抽象为人。总结起来,MetaGPT的工作流程就像:SOP是制订了一条标准化的流水线,然后Role是分布在流水线各个位置的打工人,大家各司其职,合作共赢。

3. 警告?

Agent因为涉及到多个步骤,而且大模型的能力并没有我们想象地那么强,如果不加限制,很容易陷入死循环… 这将是你财富的直接损失… 所以一定要谨慎。正如 BabyAGI里的警告:

相关文章
|
29天前
|
人工智能 自然语言处理 IDE
通义灵码 × Qwen3:编程智能体上线
通义灵码现已全面支持Qwen3,正式上线编程智能体。升级后的工具不再只是代码生成器,而是能理解任务的智能搭档,依托Qwen3能力结合MCP服务,自动感知项目结构、分析需求并调用多种工具完成编码任务。通过自然语言输入,开发者可在10分钟内完成原本需1~2天的App开发工作。此外,通义灵码支持工程级变更、自动上下文感知、工具自主使用及终端命令执行,深度集成3000+ MCP服务,覆盖DevOps全流程。目前插件下载量超1500万,累计生成代码超30亿行。体验只需将插件升级至2.5.0版本以上并在VS Code或JetBrains IDE中启用。
107 24
|
16天前
|
数据采集 存储 人工智能
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
智能体(AI Agent)开发实战之【LangChain】(二)结合大模型基于RAG实现本地知识库问答
|
2月前
|
存储 人工智能 供应链
AI Agent智能体:底层逻辑、原理与大模型关系深度解析·优雅草卓伊凡
AI Agent智能体:底层逻辑、原理与大模型关系深度解析·优雅草卓伊凡
149 2
AI Agent智能体:底层逻辑、原理与大模型关系深度解析·优雅草卓伊凡
|
22天前
|
人工智能 Cloud Native 数据可视化
微医控股与阿里云达成战略合作,双方将携手基于通义千问大模型联合打造医疗全场景智能体,共同构建医疗垂类大模型
2025年6月17日,微医控股与阿里云达成战略合作,共建医疗AI基座及医疗全场景智能体。双方将基于通义千问大模型打造医疗垂类大模型,升级微医“5+1”智能体,并在诊断、用药、健康管理等环节深化应用。微医将结合阿里云技术优势推进IDC上云,助力AI+医疗基础设施建设,共同制定行业标准并推广城市级AI数字健共体。目前,微医AI服务已连接全国1.2万家医院和30万名医生,健康管理会员超100万。
|
1月前
|
人工智能 IDE 搜索推荐
通义灵码2.5评测:从编程智能体到记忆感知的AI编码革命
通义灵码2.5版本更新带来了多项新功能,包括Lingma IDE的开箱即用体验、编程智能体模式实现端到端编码任务、MCP工具集成扩展AI助手能力以及Qwen3模型升级大幅提升代码生成准确性和效率。此外,新增长期记忆与上下文感知功能,使开发更个性化和高效。尽管存在一些局限性,如复杂业务逻辑仍需人工干预,但整体显著提升了开发效率。官方还提供了高质量视频课程助力用户学习。
419 10
|
1月前
|
人工智能 IDE 算法
通义灵码 AI IDE 上线!智能体+MCP 从手动调用工具过渡到“AI 主动调度资源”
编程智能体与 MCP 的结合,不只是“工具+助手”,而是一次范式上的跃迁——从“手动调用工具”过渡到“AI 主动调度资源”。
|
2月前
|
缓存 人工智能 自然语言处理
通义灵码2.5——基于编程智能体开发Wiki多功能搜索引擎
本文介绍了基于通义灵码2.5 AI编码助手开发的Wiki多功能搜索引擎系统。该系统采用Python技术栈,实现了多数据源统一搜索、异步并行查询和智能缓存等功能。通过AI辅助完成了从需求分析、架构设计到代码生成的全流程开发,显著提升了开发效率。系统采用模块化分层架构,包含数据源抽象层、搜索管理层和缓存层等核心组件,支持自然语言交互和个性化代码推荐。这一实践展示了AI与开发者深度协作的智能化开发新模式。
|
28天前
|
人工智能 API 开发者
智能体(AI Agent)开发实战之【LangChain】(一)接入大模型输出结果
LangChain 是一个开源框架,专为构建与大语言模型(LLMs)相关的应用设计。通过集成多个 API、数据源和工具,助力开发者高效构建智能应用。本文介绍了 LangChain 的环境准备(如安装 LangChain、OpenAI 及国内 DeepSeek 等库)、代码实现(以国内开源大模型 Qwen 为例,展示接入及输出结果的全流程),以及核心参数配置说明。LangChain 的灵活性和强大功能使其成为开发对话式智能应用的理想选择。
|
1月前
|
API 定位技术 决策智能
通义灵码产品评测报告:智能体赋能编程新时代
本次评测深度体验阿里云通义灵码(Qwen3版本),聚焦其智能体架构、MCP工具集成与记忆能力升级。通过构建天气查询与出行建议微服务,验证其从零搭建项目的能力。评测显示,通义灵码可自动感知环境、调用工具、生成代码,支持3000+ MCP服务一键集成,并具备项目级记忆和风格适应功能。最终实现高效开发闭环,大幅提升生产力。总结其核心优势为智能体自主决策、MCP生态扩展及记忆进化,但仍需优化多智能体协作与兼容性检查等功能。通义灵码重新定义编码助手边界,是开发者“超脑级”搭档。
66 0
|
1月前
|
人工智能 IDE 定位技术
通义灵码 AI IDE 正式上线,智能体自动写代码,首创自动记忆,工程感知全面升级
阿里云发布的通义灵码AI IDE深度适配千问3大模型,集成智能编码助手功能,支持编程智能体、工具调用、工程感知等能力。其核心亮点包括:支持最强开源模型千问3,全面集成通义灵码插件能力,自带编程智能体模式,支持长期记忆与行间建议预测(NES)。通义灵码已覆盖主流IDE,助力开发者实现高效智能编程,插件下载量超1500万,生成代码超30亿行,成为国内最受欢迎的辅助编程工具。立即体验更智能的开发流程!
286 0

热门文章

最新文章