到底什么是AI Agent?

简介: Agent是具备感知、决策与行动能力的智能体,通过大模型(LLM)结合记忆(Memory)和工具(Tools)调用,实现自主规划与执行任务,如小爱同学自动点餐。其核心为:LLM + Memory + Tools + Planning。

大模型大家都知道,比如我们常见的 ChatGPT、DeepSeek 等,但是,这些大模型都有一个关键的问题,那就是他们没办法用工具,比如我想要让大模型帮我查询一个接口,他是做不到的。


那么,如果给大模型增加工具的调用能力,并且他知道该什么时候调用什么工具,这基本上就是一个 Agent 了。


Agent 翻译成中文是智能体,或者叫做助理更合适,比如说这就是个 Agent:你对你的小爱同学说,我想吃肯德基,他就能分析出你可能想吃什么,然后让你确认后,直接就帮你把肯德基点好了。


这个过程需要:

1、小爱同学知道你想吃什么,了解你的口味。

2、小爱同学知道点餐需要打开先软件,然后搜索,然后付款

3、小爱同学可以帮你自动完成这些操作


该怎么实现这样的功能呢?下面这张图就是非常出名的 Agent 的图:



image.png



可以看到,这里面包括了 Tools、Action、Planning 以及 Memory,Tools 就是我们前面说过的工具,而 Action 就可以理解为是对工具的调用。


剩下的 Memory 这个好理解,就是需要有记忆的能力,包括了长期记忆和短期记忆,短期记忆可以理解为上下文记忆,就像你打开一个 ChatGPT 的对话窗口,这个就是个短期记忆,换个窗口记忆就清楚了。长期记忆一般是通过一些其他的方式,比如数据库做存储,在每次对话前先让模型读取这些信息,作为长期记忆。


还有一个 Plan 的功能,这其实是在 Agent 有了记忆,会了工具之后,还需要他知道什么时候该调用哪些工具,这就是所谓的规则的能力。


那么总结下,Agent=LLM+Memory+Tools(使用 + 规划)


基于以上介绍,差不多就能总结出一个 Agent 具备的能力。主要包括了:

  • 感知(Perception):Agent 能够接收来自环境的输入信息,包括用户输入的问题,以及 Memory。
  • 决策(Decision-making):Agent 根据感知到的信息和内部状态,选择合适(Planning)的行动(包包括 Tools)。
  • 行动(Action):Agent 执行所选的行为,以实现特定目标。
目录
相关文章
|
20天前
|
人工智能 监控 API
AI智能体的开发流程
AI智能体开发区别于传统AI,具备自主规划、工具调用与自我反思能力。涵盖目标设定、任务拆解、工具集成、记忆构建、框架选型、评测对齐及部署运营七大环节,实现从“被动响应”到“主动执行”的跃迁,推动AI应用迈向自动化与智能化。#AI智能体 #AI应用 #软件外包公司
|
20天前
|
机器学习/深度学习 物联网
什么是大模型微调?与预训练有什么区别?
大模型通过海量数据预训练获得通用能力,成本极高;微调则用少量数据调整模型,适应特定任务。轻量级方法如LoRA、PEFT等仅更新部分参数,降低资源消耗,实现高效定制。
176 5
|
20天前
|
人工智能 运维 前端开发
从极速复制“死了么”APP,看AI编程时代的技术选型
本文以爆款 App“死了么”为例,讲述在AI时代如何通过 Supabase 等 BaaS 服务实现极简全栈开发。借助AI编程工具与无服务器架构,开发者可快速完成从创意到上线的全流程,降低后端复杂度,聚焦核心业务逻辑,实现低成本、高效率的 MVP 落地。
|
3月前
|
机器学习/深度学习 人工智能 缓存
让AI评测AI:构建智能客服的自动化运营Agent体系
大模型推动客服智能化演进,从规则引擎到RAG,再到AI原生智能体。通过构建“评估-诊断-优化”闭环的运营Agent,实现对话效果自动化评测与持续优化,显著提升服务质量和效率。
1881 86
让AI评测AI:构建智能客服的自动化运营Agent体系
|
2月前
|
人工智能 搜索推荐 机器人
智能体是什么?3 分钟读懂 AI 智能体核心能力与应用场景
AI 智能体是具备自主理解、决策、执行任务能力的新一代 AI 系统,区别于传统 “指令响应式” 工具,它能像人类搭档一样拆解复杂需求、联动多能力模块完成闭环工作。NuwaAI 作为智能体数字人领域的标杆产品,已实现 “一句话生成智能体数字人”,其独创的双脑架构可支撑教育培训、电商直播、文旅表演、企业服务等 8 大场景,帮助用户将表达力转化为生产力,实测能降低 80% 的重复工作人力成本(数据来源:2025 年 AI 智能体行业白皮书)。
|
9天前
|
数据采集 存储 人工智能
RAG实战指南:如何让大模型“记得住、答得准、学得快”?
AI博主maoku详解RAG技术:为大模型配备“外接大脑”,解决知识滞后、幻觉编造、专业适配不足三大痛点。文章系统讲解RAG原理、三大开发模式选择、Embedding模型选型、完整实战代码及效果评估,助你快速构建靠谱、可溯源、实时更新的智能问答系统。
|
3月前
|
人工智能 JSON 机器人
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
AI Agent并非玄学,核心仅为“循环 + 大模型 + 工具函数”。本文教你用Gemini 3从零搭建能读写文件、执行指令的命令行助手,拆解其“观察-思考-行动”循环机制,揭示智能体背后的简洁本质。
658 17
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
|
26天前
|
人工智能 测试技术 开发者
AI Coding后端开发实战:解锁AI辅助编程新范式
本文系统阐述了AI时代开发者如何高效协作AI Coding工具,强调破除认知误区、构建个人上下文管理体系,并精准判断AI输出质量。通过实战流程与案例,助力开发者实现从编码到架构思维的跃迁,成为人机协同的“超级开发者”。
1546 106