从提示工程到代理工程:构建高效AI代理的策略框架概述

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 该文探讨了AI代理的发展,特别是ChatGPT等模型如何展示了AI系统的潜力。文章提出从提示工程转向代理工程,定义了代理能力需求,并提出一个框架来设计和实施AI代理。代理工程涉及明确代理的任务、所需行动、能力及熟练度,通过现有技术满足这些需求。文章强调了广泛和特定知识的熟练度、精确信息获取以及代理的结构设计和协调。随着技术进步,该框架为AI代理的未来发展提供了基础。

自ChatGPT推出以来,仅仅一年多的时间里,公众对于“人工智能”(AI)的认识已经发生了根本性的变化。这种变化部分源于公众意识的提高,更多则是基于这样一个认识:AI驱动的系统不仅可能,而且可能已经具备了与人类相当的能力和表现。ChatGPT不仅是AI能力的一个验证,更是半个多世纪以来AI研究成果的集中展示,向我们展示了一个可能的未来:按照Ray Kurzweil的定义,我们可以创造“执行需要智能的功能的机器”。因此,围绕AI代理的讨论和开发在近几个月里迅速增加。AI代理体现了人工智能长期以来的追求目标。

AI代理的概念虽然不新,但却始终充满吸引力。从星球大战中的C-3PO到学术界的定义,智能代理一直是AI的核心议题。随着ChatGPT、Claude和Gemini等模型的出现,这些模型在多样的知识领域都展现出强大的理解力和对话能力,AI代理的概念变得越发具体和实现可能。新增的“视觉”能力和函数调用功能,更是为AI代理的发展提供了新的可能性。

在AI代理的发展道路上,我们需要从单纯的提示工程过渡到更广泛的代理工程,并建立相应的框架、方法和思维模式,以便有效地设计和实施这些代理。本文旨在探讨LLM环境中代理工程的关键理念和原则。

我们首先定义“代理能力需求”,明确代理所需执行的功能及其所需的熟练程度。随后,在“代理工程与设计”阶段将评估可用的技术,探讨如何构建和协调代理的结构。

本框架旨在提供一个实用的思维模型,虽不全面,但足以作为一个起点,随后可根据实际需要进行细化和扩展。

代理工程框架

构建AI代理的初衷是什么?它需要完成哪些工作,实现哪些目标?在多能力代理与多代理集群之间,哪一种更适合特定的任务?人类语言的灵活性让我们能够在多个维度上扩展和深化这些概念,但这也可能导致概念上的模糊。在本框架中,我们尝试避免过度解析术语的语义差异,更注重概念的通用性和实用性。核心理念如下:

  • 代理需完成特定工作。
  • 完成工作需采取具体行动。
  • 行动的执行依赖于代理的能力。
  • 能力必须达到一定的熟练度。
  • 达到此熟练度需要相应的技术和技术协调。

能力需求与设计

设计AI代理的第一步是明确代理的职责和目标。这可能是一个高层次的目标,也可以细化为具体的任务。例如,电子商务聊天机器人可能需要处理客户咨询、分析客户行为并提供产品推荐;内容创作代理可能需要生成内容想法、起草文章或博客。

定义了任务后,接下来确定代理执行这些任务所需的具体行动。这不仅仅是定义目标,更重要的是具体化实现目标的行动步骤。此阶段也需考虑代理的自主性。例如,内容创作代理的行动可能包括调用数据分析代理获取趋势洞察、根据趋势和受众偏好生成内容想法、起草和修订文章。

所需能力的具体化

现在我们已经概述了代理执行工作所需要采取的行动,所以这些行动需要代理有不同的专业能力,比如说自然语言对话、信息检索、内容生成、数据分析、持续学习等等。它们也可以在更技术层面上表达,例如API调用、函数调用等。例如,对于内容创建代理,所需的能力可能包括:

  • 动态调用内容趋势代理的API。
  • 头脑风暴和总结能力。
  • 根据当前话题和趋势生成合适语调的内容。
  • 根据人类提供的编辑指令进行操作。
  • 记忆

选择实现这些能力的技术时,应避免限制技术选项,以确保能够灵活适应未来的技术发展。例如,尽管当前大型语言模型(LLM)备受青睐,但其他如大型行动模型(LAM)的发展可能为实现所需能力提供新的可能性。

能力和熟练度

确认代理需要的能力后,评估并定义每种能力所需的具体熟练度是至关重要的。这包括设定性能基准,如准确性、效率和可靠性等。

例如,对于我们的内容创建代理,所需的熟练度水平可能包括:

  • 功能调用的可靠性为75%。
  • 功能调用失败的解释性为99.99%。
  • 第一次尝试时,内容趋势代理的功能调用至少75%的时间能够产生相关主题。
  • 生成的内容想法在75%的时间内能够产生理想的主题。
  • 精确信息检索的精度率为99.99%。
  • 用户反馈满意度在90%或更高的编辑生成。
  • 最终草案的用户反馈满意度为90%或更高。

代理工程与设计

在明确了所需能力及其熟练度后,接下来的步骤是确定如何通过现有技术和方法满足这些要求。这涉及评估广泛的技术和方法,如LLM、信息检索增强生成(RAG)、专门的API以及其他机器学习和人工智能模型,以确定它们是否能达到所需的熟练度。

在此过程中,重要的是考虑每项技术或方法的优势和成本效益,以及它们在实现具体能力方面的适用性。

广泛知识熟练度

广泛知识是指跨广泛主题和领域的一般理解和信息。这种类型的知识对于创建能够有效进行对话、理解上下文并在各种主题上提供相关响应的AI代理至关重要。

  • LLMs — 如果你的代理的能力需要广泛的知识熟练度,好消息是LLM的开发仍在持续不断。从LlaMA3等开源模型到OpenAI、Anthropic和Google的最新专有模型,有不少技术可以在如此广泛的人类语言和知识范围内提供高密度的连贯性。
  • 提示工程 — 这个动态且非常活跃的发展领域主要关注如何激活由LLMs建模的上下文适当的知识领域。由于语言的万花筒特质,掌握这门艺术可以显著提高我们代理的能力熟练度水平。

特定知识熟练度

特定知识涉及对特定领域或主题的更深入理解。在追求我们的熟练度目标时,可能会考虑哪些技术/技术?

  • 检索增强生成(RAG) — RAG结合了LLMs的生成能力和信息检索系统,以便从外部来源合并信息。这可能是精确信息或特定知识(例如,一种独特方法的描述),LLM能够在上下文中“理解”它,因为它具有广泛的知识熟练度。
  • 模型微调 — 在特定上下文数据集上微调LLMs,使模型能够在特定设置中生成更具上下文相关性的响应。虽然不如RAG流行,但随着代理工程继续获得关注,我们可能会发现熟练度要求促使我们更频繁地转向这种技术。

精确信息

精确信息是指对需要准确答案的任务至关重要的高度准确和具体的数据点。

  • 函数调用(又名工具使用) — 无可争议的具体事实产生幻觉是AI代理的一个主要问题,所以我们可以使用函数调用来检索特定信息。例如,电子商务代理可能使用定价API提供最新的产品价格,或者使用股票市场API提供股票价值的实时更新。
  • Guardrails — Guardrails可以帮助确保代理在其响应中提供精确和准确的信息。这可以涉及基于规则的约束、有导向的对话设计和意图预处理。

代理的拆解和协调

在明确了代理的任务、所需能力及技术后,下一步是设计和协调代理的具体结构。这可能涉及将多个技术和方法整合在一起,以构建一个能够独立或在更广泛系统中协同工作的AI代理。这包括考虑如何将不同能力分配给一个或多个代理,以及如何开发可以轻松重新配置和适应新任务的代理结构。这个话题本身就涉及多篇文章,所以我们不会在这里深入讨论。

总结

从提示工程到代理工程的转变才刚刚开始,未来的路还很长。本文提出的代理工程框架只是一个起点,旨在提供一个实用的设计思路,帮助我们在AI代理的开发和实现上取得进展。随着技术的发展和新方法的出现,构建AI代理的模型和技术将不断增多,这要求我们建立能够适应各种技术的通用框架。通过明确定义代理的任务、行动和所需能力,我们为AI代理的设计和工程奠定了坚实而灵活的基础,为未来的发展提供了持续的支持和改进的可能。

https://avoid.overfit.cn/post/d8fc601394a04d3291c92b3e46fc8249

目录
相关文章
|
25天前
|
人工智能
巧妙构建歌词结构:写歌词的技巧和方法之关键,妙笔生词AI智能写歌词软件
在音乐世界里,歌词是灵魂的载体,构建其结构至关重要。优秀的歌词需有引人入胜的开头、条理清晰且富变化的主体,以及深刻难忘的结尾。《妙笔生词智能写歌词软件》提供多种功能,帮助创作者克服结构难题,激发灵感,助你写出打动人心的歌词,开启音乐创作的新篇章。
|
18天前
|
人工智能 前端开发 Java
基于开源框架Spring AI Alibaba快速构建Java应用
本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba,提升基于 Java 的大模型应用开发效率和安全性。
基于开源框架Spring AI Alibaba快速构建Java应用
|
17天前
|
人工智能 运维 NoSQL
云栖大会|多模+一体化,构建更高效的AI应用
在2024年云栖大会「NoSQL数据库」专场,多位知名企业和阿里云瑶池数据库团队的技术专家,共同分享了阿里云Lindorm、Tair、MongoDB和MyBase的最新进展与实践。Tair推出Serverless KV服务,解决性能瓶颈和运维难题;Lindorm助力AI和具身智能时代的多模数据处理;MongoDB云原生化提升开发效率;MyBase One打破云边界,提供云边端一体化服务。这些技术进展和最佳实践,展示了阿里云在NoSQL数据库领域的创新能力和广泛应用前景。
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI驱动的个性化学习平台构建###
【10月更文挑战第29天】 本文将深入探讨如何利用人工智能技术,特别是机器学习与大数据分析,构建一个能够提供高度个性化学习体验的在线平台。我们将分析当前在线教育的挑战,提出通过智能算法实现内容定制、学习路径优化及实时反馈机制的技术方案,以期为不同背景和需求的学习者创造更加高效、互动的学习环境。 ###
38 3
|
16天前
|
机器学习/深度学习 人工智能 持续交付
利用AI进行代码审查:提升软件质量的新策略
【10月更文挑战第28天】本文探讨了AI在代码审查中的应用,介绍了AI如何通过静态代码分析、代码风格检查和实时反馈提升代码质量。文章还讨论了将AI工具集成到CI/CD流程、定制化规则和结合人工审查等进阶技巧,并推荐了SonarQube和DeepCode等实用工具。未来,AI代码审查工具将更加智能,助力软件开发。
|
30天前
|
人工智能 安全 决策智能
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
|
24天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
163 6
|
25天前
|
人工智能
写歌词的技巧和方法:构建独特歌词结构的策略,妙笔生词AI智能写歌词软件
歌词创作如同搭建艺术殿堂,独特的歌词结构是其基石。掌握构建策略,让你的歌词脱颖而出。开头营造神秘氛围或出人意料的情感,主体部分采用倒叙、插叙或融合矛盾情感,结尾带来情感反转或深邃思考。《妙笔生词智能写歌词软件》提供 AI 智能写词、押韵优化等功能,助你轻松获取灵感,打造独特歌词结构。
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
31 1