【AI大模型应用开发】【AutoGPT系列】0. AutoGPT概念及原理介绍 - Agent开发框架及ReAct方法

简介: 【AI大模型应用开发】【AutoGPT系列】0. AutoGPT概念及原理介绍 - Agent开发框架及ReAct方法
  • 大家好,我是同学小张,日常分享AI知识和实战案例
  • 欢迎 点赞 + 关注 👏,持续学习持续干货输出
  • +v: jasper_8017 一起交流💬,一起进步💪。
  • 微信公众号也可搜【同学小张】 🙏

本站文章一览:


0. AutoGPT 概念 - AI Agent开发框架

AutoGPT是一个开源的AI Agent开发框架。它是一个由LLM提供动力的半自治代理,可以为您执行任何任务。只需给它设定一个或多个目标,它就会自动拆解成相对应的任务并自主运行,其运行过程无需或少需人工干预,能够根据GPT自主决策结果并结合外部资源执行相应操作,通过循环评估策略实时评估目标达成程度,来决定任务是否完成。

至于AI Agent是什么,我在前面的文章中已经详细介绍过,感兴趣的可以去看下这两篇文章:

简单来说,Agent = LLM+观察+思考+行动+记忆,将大语言模型作为一个推理引擎。给定一个任务,Agent自动生成完成任务所需的步骤,执行相应动作(例如选择并调用工具),直到任务完成。经典的概念图如下:

开源项目地址:https://github.com/Significant-Gravitas/AutoGPT

论文地址:https://arxiv.org/pdf/2306.02224.pdf

1. AutoGPT原理 - ReAct

AutoGPT的基本原理非常简单:让LLM一遍又一遍地决定要做什么,同时将其操作的结果反馈到提示中,也就是不断地“思考 + 行动”。这使得程序能够迭代地、增量地朝着其目标工作。 这也是Agent的基本原理。这种“思考 + 行动”的方式有一个官方的名字 - ReAct。

ReAct:Reason + Act的组合简写。具体参考这篇论文:https://arxiv.org/pdf/2210.03629.pdf

ReAct论文中,作者对同一个问题,对比了不同驱动大模型方式的结果(如下图):

  • a:标准Prompt,只给大模型最原始的问题,答案错误。
  • b:思维链方式(CoT),模型给出了推理过程,但答案还是错误的,这就是大模型本身的缺陷,它不可能知道所有的知识。有些大模型不知道的知识还是需要通过行动从外部获取信息。
  • c:只有行动(Act-Only),模型只是进行了一堆检索动作,并没有总结和思考答案应该是什么。
  • d:ReAct方式,采用先思考下一步干什么,然后再干,最后正确得到了结果。

    下面我们回顾一下之前学习LangChain agents模块中的运行案例,来看下ReAct的具体过程。

上面运行过程其实就是ReAct的过程:

(1)(思考 · Think Reason)先总结了任务和思考了步骤:检索当前日期,然后检索这个日期上发生的历史事件

(2)(行动 · Act)执行检索当前日期的步骤:Action是Search,输入是“今天的日期”

(3)得到了今天的日期:Observation的结果

(4)(思考 · Think Reason)再一次思考:我现在已经知道了当前日期

(5)(行动 · Act)执行第二步:Action是Search,输入是“历史上的今天发生了什么大事”

(6)得到了第二步的结果

(7)(思考 · Think Reason)再思考:知道了历史上的今天发生了什么

(8)(行动 · Act)总结输出最终回复

简单概括:思考 —> 行动 —> 得到结果 —> 思考 —> 行动 —> 得到结果 —> … —> 思考 —> 行动 —> 总结

2. AutoGPT具有的能力

  • 互联网搜索
  • 长短期记忆管理
  • 调用大模型进行文本生成
  • 存储和总结文件
  • 插件扩展:AutoGPT 可以根据不同的应用场景和用户需求进行定制化的功能增强以及使得 AutoGPT 可以与其他工具和服务进行无缝集成。

3. 总结与思考

本文我们主要了解AutoGPT是什么,以及它背后的实现原理。AutoGPT是实验性的,虽然还不成熟,但其实现思想非常值得借鉴。

AutoGPT提供了Agent的全功能,但更多的是作为一个Agent开发框架来使用。官方也鼓励用户在此架构基础上开发自己特有的或针对特定功能的Agent,从而形成AutoGPT的生态。

4. 参考

如果觉得本文对你有帮助,麻烦点个赞和关注呗 ~~~


  • 大家好,我是同学小张,日常分享AI知识和实战案例
  • 欢迎 点赞 + 关注 👏,持续学习持续干货输出
  • +v: jasper_8017 一起交流💬,一起进步💪。
  • 微信公众号也可搜【同学小张】 🙏

本站文章一览:

相关文章
|
3天前
|
前端开发 NoSQL Java
杨校老师项目之基于SpringBoot+React框架开发的医院挂号管理系统
杨校老师项目之基于SpringBoot+React框架开发的医院挂号管理系统
16 0
|
3天前
|
人工智能 自然语言处理 监控
AI大模型智能体工作流涉及使用Ollama和FastGPT这两个工具
AI大模型智能体工作流涉及使用Ollama和FastGPT这两个工具
30 4
|
6天前
|
人工智能 自然语言处理 监控
搭建本地私有AI大模型智能体
搭建本地私有AI大模型智能体
37 0
|
6天前
|
机器学习/深度学习 人工智能 算法
Agent AI智能体:塑造未来社会的智慧力量
Agent AI智能体:塑造未来社会的智慧力量
22 0
|
10天前
|
人工智能 自然语言处理 API
深入浅出 LangChain 与智能 Agent:构建下一代 AI 助手
深入浅出 LangChain 与智能 Agent:构建下一代 AI 助手
|
17天前
|
前端开发
前端React篇之React setState 调用的原理、React setState 调用之后发生了什么?是同步还是异步?
前端React篇之React setState 调用的原理、React setState 调用之后发生了什么?是同步还是异步?
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
智能化未来:Agent AI智能体的崛起与全球挑战
智能化未来:Agent AI智能体的崛起与全球挑战
51 1
|
19天前
|
人工智能 监控 前端开发
基于ReAct机制的AI Agent
当前,在各个大厂纷纷卷LLM的情况下,各自都借助自己的LLM推出了自己的AI Agent,比如字节的Coze,百度的千帆等,还有开源的Dify。你是否想知道其中的原理?是否想过自己如何实现一套AI Agent?当然,借助LangChain就可以。
|
23天前
|
机器学习/深度学习 人工智能 测试技术
世界模型也扩散!训练出的智能体竟然不错
【5月更文挑战第30天】研究人员提出了一种名为DIAMOND的新方法,将扩散模型应用于世界模型以增强强化学习智能体的训练。DIAMOND在Atari 100k基准测试中实现了1.46的人类标准化得分,刷新了完全在世界模型中训练的智能体的记录。通过生成视觉细节,智能体在多个游戏中超越人类玩家,特别是在需要精细细节识别的游戏上。不过,DIAMOND在连续控制环境和长期记忆方面的应用仍需改进。这项工作开源了代码和模型,促进了未来相关研究。论文链接:[https://arxiv.org/abs/2405.12399](https://arxiv.org/abs/2405.12399)
32 2
|
24天前
|
物联网 PyTorch 测试技术
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战
LLM 大模型学习必知必会系列(十):基于AgentFabric实现交互式智能体应用,Agent实战