《人工智能:计算Agent基础》——第2章 体系结构和分层控制

简介:

本节书摘来自华章计算机《人工智能:计算Agent基础》一书中的第2章,第2.1节,作者:(加)David L.Poole,Alan K.Mackworth 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第2章 体系结构和分层控制

所谓分层或分层系统,是指一个系统由多个相互关联的子系统组成,而每个子系统又可再次分层直至到达最底层基本子系统为止。自然界的大部分系统中,何时停止分层及什么是基本元素的随意性极大。物理学中会经常使用基本粒子的概念,但是粒子早已证实不是物质的最底层基本元素。
我们从实验观察到自然中的大部分复杂系统都展示出分层结构。从理论上讲,我们希望世界上的复杂系统都具备分层结构,其复杂系统可从简单系统演变而来。
——Herbert A.Simon[1996]

本章主要讨论智能Agent在实时环境中如何感知、推理和动作。实际上,这涉及Agent的内部结构。正如上面西蒙所指出的,层次分解是复杂系统(如智能Agent)设计中的重要部分。因此本章主要描述了用层次分解方式设计智能Agent的方法、构建智能Agent的方法以及构建“智能”所需的知识。

2.1 Agent

Agent是指在具体环境中具有动作能力的对象,如一个人、一个机器人、一条狗、一只小虫子、一阵风、重力、一盏灯或者一个能购物和售货的计算机程序。43
有意图的Agent是具有偏好的,它会偏爱于某些环境状态,并将采取行动来达到它们最偏好的状态。无意图的Agent则会聚集在一起并被称为自然。建模时需设定一个Agent是否为有意图Agent,此建模假定是否合适要根据环境来定,如在一些情境中,需要将某条狗定义为有意图的,而有时候则不需要。
如果一个Agent不具有偏好,由定义可知它不会关心其所处的环境状况,因此也不会关心自己做什么。设计此类Agent的唯一目的是逐步培养其偏好,使其更偏爱某种环境状态并尽力实现之。Agent并非必须知道自己的偏好,如一个恒温器,它只需感知环境,并控制加热器开和关即可。它嵌入了偏好,即让房间中的人员处在一个合适的温度中,尽管它并不知道自己具有此偏好。Agent的偏好一般是Agent设计者的偏好,但是有时在Agent运行中也可赋予目标和偏好。
Agent需要一个“主体”来与环境进行交互。一个嵌入式的Agent有一个物理的主体。机器人就是一个人造的具有目的性的嵌入式Agent。有些Agent则仅在信息空间存在,也被称为机器人,这里我们说的Agent指的便是此类。
本章讨论了如何构建有意图的Agent,我们用机器人作为主要的实例,因为机器人学科中已有相当多的研究,且许多术语来自于机器人学科。当然,此讨论适用于所有Agent。
Agent通过传感器来接收信息。一个Agent的动作取决于通过传感器获取的信息。这些传感器有可能反映环境的真实状态。传感器可能是有噪声的、不可靠的、坏掉的,甚至有时传感器是可靠的,但是它传回的关于环境的信息却是模棱两可的,而Agent却必须依靠其获取的信息来行动。这些信息经常很弱,例如,传感器s看上去会生成数值v。
Agent通过它们的执行器(也叫effectors)来动作。执行器同样可能是有噪声的、不可靠的、行动缓慢的或者坏掉的。Agent所控制的是其发送给执行器的信息(命令)。Agent经常会采取行动去寻找更多的环境信息,如打开橱柜门查看物件或者对学生进行测试来测定他们的知识。

目录
打赏
0
0
0
0
1408
分享
相关文章
一个支持阿里云百炼平台DeepSeek R1大模型(智能体)的Wordpress插件,AI Agent or Chatbot.
这是一个将阿里云DeepSeek AI服务集成到WordPress的聊天机器人插件,支持多轮对话、上下文记忆和自定义界面等功能。用户可通过短代码轻松添加到页面,并支持多种配置选项以满足不同需求。项目采用MIT协议授权,代码仓位于GitHub与Gitee。开发者Chi Leung为长期境外工作,代码注释以英文为主。适合需要在WordPress网站中快速部署AI助手的用户使用。
模型即产品:万字详解RL驱动的AI Agent模型如何巨震AI行业范式
未来 AI 智能体的发展方向还得是模型本身,而不是工作流(Work Flow)。像 Manus 这样基于「预先编排好的提示词与工具路径」构成的工作流智能体,短期或许表现不错,但长期必然遇到瓶颈。这种「提示驱动」的方式无法扩展,也无法真正处理那些需要长期规划、多步骤推理的复杂任务。下一代真正的LLM智能体,则是通过「强化学习(RL)与推理(Reasoning)的结合」来实现的。
59 10
模型即产品:万字详解RL驱动的AI Agent模型如何巨震AI行业范式
AI Agent:构建以数据为中心的智能体
在过去一年里大模型领域主要有两大领域的热点,一个是 LLM,几乎每月速度革新,大家关心的是效果和成本。另一个是 AI Agent,大家尝试解决各个领域应用问题,大家关心的是场景和竞争力。下面我们重点分享一下 AI Agent 的趋势和实践。
Agent TARS:一键让AI托管电脑!字节开源PC端多模态AI助手,无缝集成浏览器与系统操作
Agent TARS 是一款开源的多模态AI助手,能够通过视觉解析网页并无缝集成命令行和文件系统,帮助用户高效完成复杂任务。
2558 10
Agent TARS:一键让AI托管电脑!字节开源PC端多模态AI助手,无缝集成浏览器与系统操作
Manus:或将成为AI Agent领域的标杆
随着人工智能技术的飞速发展,AI Agent(智能体)作为人工智能领域的重要分支,正逐渐从概念走向现实,并在各行各业展现出巨大的应用潜力。在众多AI Agent产品中,Manus以其独特的技术优势和市场表现,有望成为该领域的标杆。作为资深AI工程师,本文将深入探讨Manus的背景知识、主要业务场景、底层原理、功能的优缺点,并尝试使用Java搭建一个属于自己的Manus助手,以期为AI Agent技术的发展和应用提供参考。
11487 19
清华、面壁提出创新AI Agent交互:能主动思考、预测需求
清华大学与面壁智能团队提出了一种创新的AI Agent交互模式,将基于大型语言模型的智能体从被动响应转变为主动协助。通过数据驱动的方法,研究团队开发了能够预测和主动发起任务的智能体,并创建了ProactiveBench数据集。实验结果显示,经过微调的模型在主动性方面取得了66.47%的F1分数,展示了该方法在人机协作中的潜力。论文链接:https://arxiv.org/abs/2410.12361
63 2
Social Media Agent:告别文案焦虑!AI自动生成高转化帖子,输入URL快速生成爆款文案
Social Media Agent 是一款由 LangChain 推出的 AI 社交媒体内容管理工具,支持 Twitter 和 LinkedIn 平台,能快速生成高质量的帖子。
93 17
Social Media Agent:告别文案焦虑!AI自动生成高转化帖子,输入URL快速生成爆款文案
谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!
谷歌近日推出基于“快慢思维”理论的双思维AI Agent系统,模仿人类大脑的两种思维模式:快速直观的Talker(系统1)和深思熟虑的Reasoner(系统2)。Talker负责日常对话与快速响应,Reasoner则处理复杂推理任务。该系统模块化设计,灵活高效,已在睡眠教练等场景中展现应用潜力,但仍面临工作负载平衡与推理准确性等挑战。论文详情见:https://arxiv.org/abs/2410.08328v1
82 1

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等