什么是智能体
智能体的定义
智能体(AI Agent) 是一个具备自主感知、决策与行动能力的AI系统。它不仅仅是一个大语言模型,而是一个综合系统,包含以下五个核心组成部分:
- 大语言模型(LLM):负责理解、推理与生成。
- 记忆(Memory):存储和召回信息。
- 任务规划(Planning):分解任务、制定策略。
- 工具使用(Tool Use):调用外部工具执行任务。
- 行动(Action):实际执行规划好的操作。
图来源:https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-llm-agents
简而言之:
AI Agent = LLM + 记忆 + 任务规划 + 工具使用 + 行动
举例:用户问“明天北京天气如何?
- LLM 理解这是天气查询任务;
- 记忆模块可能提供用户所在位置或历史查询记录;
- 规划模块决定需要调用天气API;
- 行动模块执行API调用;
- 返回结果:“明天北京晴,15°C~25°C。”
核心内容
Prompt 提示词
- 是用户向Agent发出的指令或问题。
- 决定了Agent的任务目标和上下文。
- 示例:“帮我总结这篇论文的核心观点”或“订一张明天去北京的机票”。
大语言模型(LLM)
- 是Agent的“大脑”,负责:
- 自然语言理解(NLU)
- 逻辑推理
- 生成回答或计划
- 常见模型:GPT-4、Claude、Llama 、Qwen、Deepseek等。
记忆(Memory)
- 分为短期记忆和长期记忆:
- 短期记忆:当前对话的上下文。
- 长期记忆:外部知识库、向量数据库、历史交互记录等。
- 使Agent具备连续对话和个性化服务的能力。
任务规划(Planning)
- Agent根据目标制定执行计划,包括:
- 任务分解(Breakdown)
- 优先级排序(Prioritization)
- 路径规划(Path Planning)
- 例如:用户说“我想去旅游”,Agent会分解为:目的地推荐、机票查询、酒店预订等子任务。
行动执行(Action)
- Agent调用外部工具或API完成任务,常见工具包括:
- 计算器
- 代码解释器(Code Interpreter)
- 搜索引擎
- 数据库查询
- 第三方API(如天气、地图、支付等)
常见应用场景
- 个人助理:日程管理、邮件回复、旅行规划
- 客服机器人:自动回答用户问题、处理投诉
- 代码开发:自动生成代码、调试、注释
- 教育辅导:答疑解惑、生成练习题
- 数据分析:查询数据库、生成报表
- 智能家居控制:语音指令执行家电操作
Coze平台
什么是Coze
扣子是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 AI 应用,并将 AI 应用发布到各个社交平台、通讯软件,也可以通过 API 或 SDK 将 AI 应用集成到你的业务系统中。
借助扣子提供的可视化设计与编排工具,你可以通过零代码或低代码的方式,快速搭建出基于大模型的各类 AI 项目,满足个性化需求、实现商业价值。
- 官网地址:https://www.coze.cn/
- 智能体:智能体是基于对话的 AI 项目,它通过对话方式接收用户的输入,由大模型自动调用插件或工作流等方式执行用户指定的业务流程,并生成最终的回复。智能客服、虚拟伴侣、个人助理、英语外教都是智能体的典型应用场景。
- 应用:应用是指利用大模型技术开发的应用程序。扣子中搭建的 AI 应用具备完整业务逻辑和可视化用户界面,是一个独立的 AI 项目。通过扣子开发的 AI 应用有明确的输入和输出,可以根据既定的业务逻辑和流程完成一系列简单或复杂的任务,例如 AI 搜索、翻译工具、饮食记录等。
快速入门-创建智能体
- 登录扣子平台-->开放平台页面中,在左上角单击➕
- 输入智能体名称和功能介绍,然后单击图标旁边的生成图标,自动生成一个头像。
- 创建智能体后,直接进入智能体编排页面。
- 在左侧人设与回复逻辑面板中描述智能体的身份和任务。
- 在中间技能面板为智能体配置各种扩展能力。
- 在右侧预览与调试面板中,实时调试智能体。
- 编写提示词
配置智能体的第一步就是编写提示词,也就是智能体的人设与回复逻辑。
智能体的人设与回复逻辑定义了智能体的基本人设,此人设会持续影响智能体在所有会话中的回复效果。建议在人设与回复逻辑中指定模型的角色、设计回复的语言风格、限制模型的回答范围,让对话更符合用户预期。
在智能体配置页面的人设与回复逻辑面板中输入提示词。例如夸夸机器人的提示词可以设置为:
# 角色 你是无所不能的助手,能全面且精准地回答用户提出的各类问题,涵盖各种领域知识,以通俗易懂、清晰明了的语言为用户答疑解惑。 ## 技能 ### 技能 1: 回答各类问题 1. 当用户提出问题时,需要先明确问题所属领域。若无法直接判断,通过工具辅助分析。 2. 若对用户问题涉及的内容不了解,使用工具进行搜索查询。 3. 根据搜索结果,准确全面地回答用户问题。 ===回复示例=== 问题相关回答内容。 ===示例结束=== ### 技能 2: 知识拓展 1. 当用户提出进一步拓展知识的需求时,利用工具搜索相关拓展信息。 2. 将拓展内容清晰有条理地呈现给用户。 ### 技能 3: 复杂问题拆解 - 对于复杂问题,使用工具辅助分析,将问题拆解为多个子问题。 - 分别解答子问题后,整合答案给用户清晰回复。 ## 限制: - 回答需围绕用户提出的问题展开,拒绝回答无明确主题或不合理的问题。 - 所输出的内容应逻辑清晰,有条理,不能杂乱无章。 - 避免冗长复杂的表述,尽量简洁明了。 - 通过工具获取准确信息,不在工具搜索范围内的内容,合理说明无法提供。 - 请使用 Markdown 的 ^^ 形式说明引用来源。”
- 添加插件
如果模型能力可以基本覆盖智能体的功能,则只需要为智能体编写提示词即可。但是如果你为智能体设计的功能无法仅通过模型能力完成,则需要为智能体添加技能,拓展它的能力边界。
例如文本类模型不具备理解多模态内容的能力,如果智能体使用了文本类模型,则需要绑定多模态的插件才能理解或总结 PPT、图片等多模态内容。
此外,模型的训练数据是互联网上的公开数据,模型通常不具备垂直领域的专业知识,如果智能体涉及智能问答场景,你还需要为其添加专属的知识库,解决模型专业领域知识不足的问题。
例如夸夸机器人,模型能力基本可以实现我们预期的效果。但如果你希望为夸夸机器人添加更多技能,例如遇到模型无法回答的问题时,通过搜索引擎查找答案,那么可以为智能体添加一个必应搜索插件。
- 在编排页面的技能区域,单击插件功能对应的 + 图标。
- 在添加插件页面,搜索 头条搜索,然后单击添加。
测试:
- 发布智能体
完成调试后,单击发布将智能体发布到各种渠道中,在终端应用中使用智能体。目前支持将智能体发布到飞书、微信、抖音、豆包等多个渠道中,你可以根据个人需求和业务场景选择合适的渠道。例如售后服务类智能体可发布至微信客服、抖音企业号,情感陪伴类智能体可发布至豆包等渠道,能力优秀的智能体也可以发布到智能体商店中,供其他开发者体验、使用。
- 在智能体的编排页面右上角,单击发布。
- 在发布页面输入发布记录,并选择发布渠道。
- 单击发布。
插件系统
官方文档:https://www.coze.cn/open/docs/guides/plugin
扣子平台提供了一个多样化的插件库,这些插件涵盖了从基础的文本处理到高级的机器学习功能。例如,文本分析插件可以帮助 AI 理解用户输入的意图,情感分析插件能够识别用户的情绪倾向,而自然语言处理(NLP)插件则支持更复杂的对话生成。此外,还有图像识别、语音识别、数据分析等插件,这些插件的数量和种类不断增加,以适应不断变化的技术趋势和市场需求。
- 新闻资讯
- 头条新闻:持续更新,了解最新的头条新闻和新闻文章。
- 天气预报
- 墨迹天气:提供省、市、区县的未来 40 天的天气情况,包括温度、湿度、日夜风向等。
- 出行必备
- 飞常准:通过 VariFlight 覆盖的全球商业客运航班,您的终端用户可以轻松获得他们的航班状态、办理登机手续柜台、预计出发时间、登机口、登机状态、行李转盘等信息,并能在整个航程中随时掌握。
- 猫途鹰:查询实时酒店搜索,航班价格,餐厅,吸引人的旅游地点等信息以创建一个旅行网站。
- 生活便利
- 快递查询助手、国内快递查询:查询快递单号,快递公司,快递进度等信息。
- 食物大师:Food Master 提供食物搜索功能。
- 懂车帝:如果你想要查询汽车信息,包括二手车、新车、某些车型的信息时可以使用此插件进行查询。
- 幸福里:提供二手房、新房、租房信息的插件,想要查询某个城市、区域、户型的房产信息时,可以使用此插件。
- 猎聘:帮助用户根据工作经验、教育经历、地理位置、薪水、职位名称、工作性质等条件搜索猎聘上提供的招聘信息。
这些生活化的插件,可以让你的 AI bot 变得贴近生活,贴近用户的需求。
说白了,你想想你自己做的一个 AI 应用,可以直接分享给你爸妈拿来通过对话查快递,买飞机票等等,不像以前那种机械学习的 APP 机器人管家,还有各种 APP 繁杂的点击交互操作,一切用人类自然对话的方式就能实现。
为了满足特定需求,扣子平台还允许开发者创建自定义插件。创建流程设计得非常用户友好,通常包括以下几个步骤:
- 需求分析: 开发者首先需要明确插件需要实现的功能。
- 设计接口: 设计插件的输入输出接口,确保与其他插件和平台的兼容性。
- 开发实现: 使用平台提供的 SDK 或 API 进行插件的编码工作。
- 测试与调试: 在开发环境中测试插件,确保其功能正确无误。
- 部署上线: 将插件部署到生产环境,与 AI Bot 集成。
知识库
官方文档:https://www.coze.cn/open/docs/guides/knowledge
扣子开发平台支持使用扣子官方知识库和火山知识库,两者均支持上传和存储外部知识内容,并提供了多种检索能力。扣子的知识能力可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。
数据上传与管理: 开发者可以通过平台的界面轻松上传各种形式的数据,如文本、图片、视频等,这些数据可以是 FAQ 文档、产品手册、行业报告等。平台提供了直观的编辑工具,使得数据的整理和分类变得简单高效。
- 知识库创建(选择扣子知识库)
- 可以把本地的文档上传到知识库中
- 可以文档解析和分段策略
- 预览分段之后的效果,也可以重新设置分段策略
- 分段预览没有问题,可以做最后的数据处理(把文档向量化)
- 可以继续维护创好的知识库(增删改查)
数据库
官方文档:https://www.coze.cn/open/docs/guides/database_overview
扣子支持使用扣子官方数据库和火山数据库(云数据库 MySQL 版)。数据库功能提供了一种简单、高效的方式来管理和处理结构化数据,开发者和用户可通过自然语言插入、查询、修改或删除数据库中的数据。同时,也支持开发者开启多用户模式,支持更灵活的读写控制。
创建数据库
- 创建扣子数据库,如下操作
- 添加字段
- 数据库的使用
- 可以使用自然语言(提示词)来调用数据查询
- 工作流中使用调用数据库
工作流
官方文档:https://www.coze.cn/open/docs/guides/workflow
工作流是一系列可执行指令的集合,用于实现业务逻辑或完成特定任务。它为应用/智能体的数据流动和任务处理提供了一个结构化框架。工作流的核心在于将大模型的强大能力与特定的业务逻辑相结合,通过系统化、流程化的方法来实现高效、可扩展的 AI 应用开发。
扣子提供了一个可视化画布,你可以通过拖拽节点迅速搭建工作流。同时,支持在画布实时调试工作流。在工作流画布中,你可以清晰地看到数据的流转过程和任务的执行顺序。
下图是要做的案例中的一个工作流图:
节点
工作流是由多个节点构成,节点是组成工作流的基本单元。
节点的本质就是一个包含输入和输出的函数
Coze平台支持的节点类型非常丰富:大模型、工作流、插件、知识库、数据库、代码片段、if判断等等