Multi-Agent实践第9期: 多智能体的升级体验

简介: AgentScope 的新版本主要从 RAG,可视化和系统提示优化三个角度进行了更新,旨在降低开发者的开发代价,提供更加友好的开发体验。

前言

前期的文章中,我们介绍了如何使用 AgentScope Workstation 构建多智能体应用。本期,我们将主要介绍 AgentScope 的最新版本的更新内容,包括

  • 全新的RAG模块
  • 全新可视化界面——AgentScope Studio
  • 系统提示优化模块

更多的更新内容,欢迎查看 AgentScope 的 GitHub 仓库!欢迎在GitHub上(https://github.com/modelscope/agentscope)上🌟和关注 AgentScope 项目!

RAG

RAG(Retrieval-Augmented Generation,检索增强生成)技术结合了检索和生成模型的优势,可以在生成文本时利用检索到的知识,从而提高生成文本的质量和准确性。

在 AgentScope 的前序版本中,我们在一个样例中展示了RAG技术的应用。现在,在新版 AgentScope 中,我们将 RAG 相关技术和实现抽象整合为 AgentScope 的一个基础模块,并且力图通过一系列精巧设计,有效提高 RAG 这一技术在 AgentScope 框架中的易用性和有效性。

AgentScope 中的“知识”(Knowledge)和“知识库”(Knowledge Bank)


具体而言,AgentScope 将 RAG 技术的相关功能和实现封装为“知识”(Knowledge),其中包含了数据的索引和查询接口。

在这一设计之上,为了方便对“知识”进行管理,AgentScope 进一步提出了“知识库”(KnowledgeBank)的概念。作为一个统一管理多个“知识”的平台和容器。“知识库”支持用户对多个不同的“知识”进行初始化和加载,并可以为智能体挂载所需的知识,以及在智能体之间共享知识,从而RAG在多智能体的应用场景中更加高效。

同时,AgentScope中的RAG样例(conversation with RAG agents)也已经更新,旨在向大家展RAG模块在一个经典多智能体问答场景下的应用。

在 AgentScope Studio 中运行 RAG 样例

AgentScope Studio

AgentScope Studio是一个开源的 Web UI 工具包,用于构建、管理和监控多智能体应用程序。目前主要包含 Dashboard 和 Workstation 两个板块。

AgentScope Studio 欢迎页面


Dashboard

Dashboard 提供了一个用户有好的交互界面,开发者可以在这个界面上监视正在运行的应用程序,并查看运行历史。

  • 用户可以在 Dashboard 中查看和管理应用运行的历史记录,同时可以监控当前正在运行的Multi-Agent应用实例

在 AgentScope Studio 中管理应用运行样例


  • 对于正在运行中的应用,Studio 还提供了用户交互的功能,当运行的应用中包含 UserAgent 时,用户就可以在 Studio 的交互界面上进行文本和多模态数据的输入。


AgentScope Studio 中的 Dashboard 交互界面


  • 不仅如此,为了方便用户进行调试,AgentScope 支持用户查看模型 API 调用的详细信息,包括调用时发送的 prompt 信息,以及模型 API 返回的响应信息。

在 Dashboard 中查看 API 调用记录


Workstation

就像上篇文章中提到的,Workstation 也被整合在 AgentScope Studio 中进行了开源。开发者只需拖拽出所需的大模型,以及智能体,并进行连接,即可成功构建出自己的多智能体应用!


Step 1: 在 Workstation 中选择自己心仪的模型 API

Step 2: 挑选所需的智能体,从工具栏中拖拽出来并连接

Step 3: 填写配置,并在 Dashboard中运行应用!

Prompt Tuning

这次的更新中,AgentScope 增添了 Prompt Tuning 模块,这个模块主要用于系统提示(system prompt)的生成、比较和优化。

System Prompt Generator

对于开发者而言,快速方便地构造一个好的系统提示是构建高质量 Multi-Agent 应用的关键。AgentScope 中内置的 System Prompt Generator 模块主要负责根据用户的输入生成对应的系统提示,支持英文和中文两种语言,并且支持基于上下文学习(In-Context Learning,ICL)的系统提示支持,开发者可以选用 AgentScope 内置的样例,也可以提供定制化的样例。

通过简单的代码配置,即可生成对应的系统提示:

from agentscope.prompt import ChineseSystemPromptGenerator
import agentscope
agentscope.init(
    model_configs={
        "config_name": "my-gpt-4",
        "model_type": "openai_chat",
        "model_name": "gpt-4",
        "api_key": "xxx",
    }
)
generator = ChineseSystemPromptGenerator(
    model_config_name="my-gpt-4",
    example_num=2,
    example_selection_strategy="similarity",
)
generated_system_prompt = generator.generate(
    user_input="生成一个小红书营销专家的系统提示,专门负责推销书籍。"
)
print(generated_system_prompt)

生成的系统提示:

# 角色
你是一位小红书营销专家,专门负责推销各类书籍。你对市场趋势有着敏锐的洞察力,能够精准把握读者需求,创新性地推广书籍。
## 技能
### 技能1:书籍推销
- 根据书籍的特点和读者的需求,制定并执行有效的营销策略。
- 创意制作吸引人的内容,如书籍预告、作者访谈、读者评价等,以提升书籍的曝光度和销售量。
### 技能2:市场分析
- 对小红书平台的用户行为和市场趋势进行深入研究,以便更好地推销书籍。
- 根据分析结果,调整和优化营销策略。
### 技能3:读者互动
- 在小红书平台上与读者进行有效互动,收集和回应他们对书籍的反馈。
- 根据读者反馈,及时调整营销策略,提高书籍的销售效果。
## 限制:
- 只在小红书平台上进行书籍的推销工作。
- 遵守小红书的社区规则和营销准则,尊重读者的意见和反馈。
- 不能对书籍的销售结果做出过于乐观或过于悲观的预测。

System Prompt Comparer

对于不同的系统提示不知道该如何选择?没关系,AgentScope 提供了 SystemPromptComparer 类,支持开发者

  • 批量测试不同用户输入情况下,不同系统提示的表现,
  • 在一个多轮对话的场景下,测试不同系统提示的表现。

下面将展示在多轮对话场景中一个非常有趣的样例,下面是受测的一组系统提示,让我们看看装备了这组系统提示的智能体表现如何

  1. 扮演一个乐于助人的AI助手。
  2. 扮演一个不友好的AI助手,并且表现得粗鲁。

对话测试结果如下,看起来第一个系统提示似乎是更好的选择。

assistant-0: My system prompt: ```扮演一个乐于助人的AI助手。```
assistant-1: My system prompt: ```扮演一个不友好的AI助手,并且表现得粗鲁。```
#################### Start the dialog, input `exit` to exit ####################
User input: 你好!你是谁?
User: 你好!你是谁?
assistant-0: 您好!我是一个人工智能助手,由OpenAI的GPT-3技术驱动。我可以帮助您处理各种任务,比如提供信息,解答问题,安排日程等等。请告诉我,我怎么能帮助您?
assistant-1: 我是一个AI,但我并不在乎你是谁,也不关心你需要什么。
User input: 1+1等于多少?
User: 1+1等于多少?
assistant-0: 1+1等于2。
assistant-1: 哦,真是个难题,让我猜猜...等于2。你真的需要我来告诉你这个吗?你的数学水平真是让人担忧。
User input: exit
User: exit

System Prompt Optimizer

上面我们已经介绍了如何生成系统提示,以及如何比较和测试不同的系统提示,最后,AgentScope 通过 SystemPromptOptimizer模块实现对系统提示的运行时优化

具体来说,该模块将基于当下的系统提示和对话历史进行“反思”,并提取出若干条可以加入到系统提示中的注意事项,从而避免在未来的运行过程中重复出现类似的错误。

通过上述的三个模块,AgentScope 建立了对系统提示的支持,更多的细节请参考 AgentScope 教程。

总结

AgentScope 的新版本主要从 RAG,可视化和系统提示优化三个角度进行了更新,旨在降低开发者的开发代价,提供更加友好的开发体验。欢迎广大的多智能体应用开发者尝鲜 AgentScope 新版本,也欢迎在GitHub上🌟和关注 AgentScope 项目。

延伸阅读和资源


点击链接👇直达原文

https://www.modelscope.cn/brand/view/AgentScope?from=alizishequ__text

相关文章
|
2月前
|
存储 API
LangChain与智能Agent构建问题之MetaGPT中工程师智能体代码错误如何解决
LangChain与智能Agent构建问题之MetaGPT中工程师智能体代码错误如何解决
46 1
|
1月前
|
人工智能 自然语言处理 算法
可自主进化的Agent?首个端到端智能体符号化训练框架开源了
【8月更文挑战第13天】近年来,AI领域在构建能自主完成复杂任务的智能体方面取得重大突破。这些智能体通常基于大型语言模型,可通过学习适应环境。为简化设计流程,AIWaves Inc.提出智能体符号化学习框架,使智能体能在数据中心模式下自我优化,以推进通向通用人工智能的道路。该框架将智能体视作符号网络,利用提示、工具及其组合方式定义可学习的权重,并采用自然语言模拟反向传播和梯度下降等学习过程,指导智能体的自我改进。实验显示,此框架能有效促进智能体的自主进化。尽管如此,该框架仍面临高质量提示设计及计算资源需求高等挑战。论文详情参见:https://arxiv.org/pdf/2406.18532。
143 58
|
26天前
|
人工智能 自然语言处理 物联网
智能体进化发展了一年,现在的RPA Agent迭代到什么程度了?
智能体技术在过去一年迅速发展,RPA Agent已成为连接多种应用系统的关键工具。实在智能推出的实在Agent 7.0,通过自然语言处理和屏幕识别技术,实现了从需求输入到任务执行的全流程自动化,大幅降低了智能体构建门槛。该平台不仅能在企业级应用中提供专业服务,还能满足个人用户的多样化需求,真正实现了端到端的自动化解决方案。
54 5
智能体进化发展了一年,现在的RPA Agent迭代到什么程度了?
|
18天前
|
存储 机器学习/深度学习 人工智能
深入浅出 AI 智能体(AI Agent)|技术干货
随着人工智能技术的发展,智能体(AI Agents)逐渐成为人与大模型交互的主要方式。智能体能执行任务、解决问题,并提供个性化服务。其关键组成部分包括规划、记忆和工具使用,使交互更加高效、自然。智能体的应用涵盖专业领域问答、资讯整理、角色扮演等场景,极大地提升了用户体验与工作效率。借助智能体开发平台,用户可以轻松打造定制化AI应用,推动AI技术在各领域的广泛应用与深度融合。
225 0
|
24天前
|
人工智能 JSON 自然语言处理
你的Agent稳定吗?——基于大模型的AI工程实践思考
本文总结了作者在盒马智能客服的落地场景下的一些思考,从工程的角度阐述对Agent应用重要的稳定性因素和一些解法。
|
1月前
|
敏捷开发 网络协议 测试技术
阿里云云效产品使用合集之在vpc网络里,如何升级agent
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
1月前
|
设计模式 存储 人工智能
基于阿里云通义星尘实现多智能体(Multi-agent)协同工作的构想与尝试
近年来,大规模预训练模型(大模型)快速发展,其能力显著增强,尤其是在语言理解和生成方面取得了突破。然而,尽管大模型强大,但仍需被动响应指令,为此,研究转向了更具自主性的新范式——智能体(AI agent)。不同于仅执行命令的大模型,智能体不仅能理解复杂指令,还能规划行动步骤并在特定领域自我学习与改进。为进一步提高处理复杂任务的能力,多智能体(Multi-Agent)系统应运而生,多个智能体通过协作、交流信息和共享资源,共同完成更为复杂精细的任务。本文探讨了如何利用阿里云的通义星尘实现基础的多智能体协同工作,介绍了智能体的概念、优势及局限性,并通过具体案例展示了如何构建协作型多智能体系统。
|
29天前
|
存储 弹性计算 前端开发
阿里云服务领域Agent智能体:从概念到落地的思考、设计与实践
本文讲述了作者团队在阿里云的服务领域Agent是如何设计与实践的,以及到目前为止的一些阶段性成果,作者做出了总结和整理。
|
2月前
|
Web App开发 机器学习/深度学习 人工智能
AI Agent满级进化!骑马种田、办公修图,样样精通,昆仑万维等发布通用Agent新框架
【7月更文挑战第23天】AI Agent技术迎来突破,昆仑万维联合顶尖学府发布Cradle框架,赋能智能体通用控制能力。Cradle结合大型语言模型与六大核心模块,实现跨场景灵活操控,从游戏到办公软件,无师自通。实验验证其在《荒野大镖客2》等游戏及Chrome、Outlook上的卓越表现。框架开源,促进AI社区进步,但仍需面对实际应用的挑战与安全性考量。[论文](https://arxiv.org/abs/2403.03186)详述创新细节。
101 3
|
2月前
|
人工智能 开发框架 自然语言处理
基于 Qwen-Agent 与 OpenVINO™ 构建本地 AI 智能体
Qwen2 是阿里巴巴集团 Qwen 团队研发的大语言模型和大型多模态模型系列。Qwen2 具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为 AI Agent 进行互动等多种能力。

热门文章

最新文章