AutoAgent:无需编程!接入DeepSeek用自然语言创建和部署AI智能体!港大开源框架让AI智能体开发变成填空题

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 香港大学推出的AutoAgent框架通过自然语言交互实现零代码创建AI智能体,支持多模型接入与自动化工作流编排,在GAIA基准测试中表现优异。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🎯 「开发者解放双手!港大开源框架让AI智能体开发变成填空题」

大家好,我是蚝油菜花。你是否也经历过这些开发噩梦——

  • 👉 想做个智能助手却卡在API对接,文档看到瞳孔地震
  • 👉 调试多智能体协作时,日志复杂得像摩斯密码
  • 👉 明明有顶级LLM,却因工程化门槛只能跑Demo...

今天要介绍的 AutoAgent ,正在颠覆AI智能体开发方式!这个港大开源框架用三大黑科技:

  • 自然语言编程:描述需求即可生成智能体,无需写一行代码
  • 自进化架构:智能体能动态优化工具和工作流
  • 多模型支持:无缝切换Claude/GPT/DeepSeek等主流LLM

已有团队用它1天搭建跨境电商客服系统,金融分析师靠它自动生成投研报告——你的AI生产力,是时候开启「自动驾驶」模式了!

🚀 快速阅读

AutoAgent是香港大学推出的零代码LLM智能体开发框架。

  1. 功能:支持用户模式、智能体编辑器和工作流编辑器三种交互方式
  2. 技术:采用Agentic System Utilities架构,内置自管理向量数据库

AutoAgent 是什么

AutoAgent-cover

AutoAgent 是基于自然语言交互的自动化LLM智能体框架,用户无需编程即可创建定制化AI助手。其核心设计理念是将智能体开发转化为对话过程,通过多代理协作系统自动完成工具创建、任务分解和流程优化。

框架采用模块化设计,包含Agent Profiling Agent、Tool Editor Agent等核心组件,支持函数调用与ReAct双模式交互。在GAIA基准测试中,使用Claude 3.5的AutoAgent取得了与OpenAI Deep Research相当的性能,成为当前最强的开源替代方案之一。

AutoAgent 的主要功能

AutoAgent-features

  • 用户模式:开箱即用的多智能体系统,支持文件上传与复杂任务处理
  • 智能体编辑器:通过对话配置AI助手参数和任务逻辑
  • 工作流编辑器:用自然语言描述自动生成多步骤业务流程
  • 双交互模式:同时支持函数调用和ReAct推理策略
  • 向量数据库:内置自管理知识库实现长期记忆与RAG增强

AutoAgent 的技术原理

AutoAgent

  • 自然语言驱动:Agent Profiling Agent将用户需求转化为结构化代理描述
  • LLM行动引擎:采用Direct/Transformed双范式生成可执行动作
  • 动态工具创建:Tool Editor Agent自动生成并集成第三方API工具
  • 多代理协作:Orchestrator代理实现任务分解与分布式执行
  • 自优化架构:支持智能体在工作过程中持续改进策略

如何运行 AutoAgent

下面将详细介绍如何运行 AutoAgent,包括安装、配置 API 密钥、以及通过 CLI 模式启动框架。

安装 AutoAgent

AutoAgent 安装

使用以下命令克隆 AutoAgent 仓库并安装依赖:

git clone https://github.com/HKUDS/AutoAgent.git
cd AutoAgent
pip install -e .

Docker 安装

AutoAgent 使用 Docker 容器化代理交互环境。首先确保已安装Docker。AutoAgent 会根据您的机器架构自动拉取预构建的镜像,无需手动操作。

配置 API 密钥

.env 文件中设置所需的 API 密钥。以下是一个示例配置:

# 必须的 GitHub Token
GITHUB_AI_TOKEN=your_github_token

# 可选的 API 密钥
OPENAI_API_KEY=your_openai_api_key
DEEPSEEK_API_KEY=your_deepseek_api_key
ANTHROPIC_API_KEY=your_anthropic_api_key
GEMINI_API_KEY=your_gemini_api_key
HUGGINGFACE_API_KEY=your_huggingface_api_key
GROQ_API_KEY=your_groq_api_key
XAI_API_KEY=your_xai_api_key

注意:并非所有 API 密钥都是必需的,只需配置您需要的 LLM 提供商的密钥。

启动 CLI 模式

AutoAgent 提供了两种 CLI 模式:auto mainauto deep-research。以下是启动方式的详细说明。

使用 auto main 启动完整功能

此命令支持 user modeagent editorworkflow editor 模式。运行以下命令以启动:

auto main

使用 auto deep-research 启动轻量模式

此命令仅启动 user mode,适合快速使用。运行以下命令:

auto deep-research

配置选项

以下是 auto main 命令的常用配置选项:

  • --container_name:Docker 容器名称(默认为 deepresearch)。
  • --port:容器端口(默认为 12346)。
  • COMPLETION_MODEL:指定使用的 LLM 模型,需遵循Litellm的命名规则(默认为 claude-3-5-sonnet-20241022)。
  • DEBUG:启用调试模式以查看详细日志(默认为 False)。
  • API_BASE_URL:LLM 提供商的 API 基础 URL(默认为 None)。
  • FN_CALL:启用函数调用(默认为 None)。

  • Litellmhttps://github.com/BerriAI/litellm

使用不同 LLM 提供商启动

你可以选择使用 DeepSeek 作为 LLM 提供商启动 AutoAgent:

DeepSeek

  • .env 文件中设置 DEEPSEEK_API_KEY
DEEPSEEK_API_KEY=your_deepseek_api_key
  • 运行以下命令以启动Auto-Deep-Research。
COMPLETION_MODEL=deepseek/deepseek-chat auto main

以下是使用其他 LLM 提供商启动 AutoAgent 的示例:

Anthropic

ANTHROPIC_API_KEY=your_anthropic_api_key
auto main

OpenAI

OPENAI_API_KEY=your_openai_api_key
COMPLETION_MODEL=gpt-4o auto main

Mistral

MISTRAL_API_KEY=your_mistral_api_key
COMPLETION_MODEL=mistral/mistral-large-2407 auto main

Gemini

GEMINI_API_KEY=your_gemini_api_key
COMPLETION_MODEL=gemini/gemini-2.0-flash auto main

Huggingface

HUGGINGFACE_API_KEY=your_huggingface_api_key
COMPLETION_MODEL=huggingface/meta-llama/Llama-3.3-70B-Instruct auto main

Groq

GROQ_API_KEY=your_groq_api_key
COMPLETION_MODEL=groq/deepseek-r1-distill-llama-70b auto main

OpenAI-Compatible Endpoints(如 Grok)

OPENAI_API_KEY=your_api_key_for_openai_compatible_endpoints
COMPLETION_MODEL=openai/grok-2-latest API_BASE_URL=https://api.x.ai/v1 auto main

OpenRouter(如 DeepSeek-R1)

OPENROUTER_API_KEY=your_openrouter_api_key
COMPLETION_MODEL=openrouter/deepseek/deepseek-r1 auto main

AutoAgent-start.png

使用 user mode 创建代理

user mode 是一个开箱即用的多代理系统,能够通过自然语言创建和管理代理工具、工作流等。以下是使用 user mode 的步骤:

  1. 输入您希望创建的代理类型。
  2. AutoAgent 自动生成代理配置文件。
  3. 根据提示创建所需的工具和任务。
  4. 最终生成的代理可以立即使用。

使用 agent editorworkflow editor 创建代理

agent editor

  1. 输入您希望创建的代理类型。
  2. AutoAgent 自动生成代理配置文件。
  3. 创建所需的工具并完成任务设置。
  4. 生成代理并进入下一步。

workflow editor

  1. 输入您希望创建的工作流描述。
  2. AutoAgent 自动生成工作流配置文件。
  3. 完成任务设置并生成工作流。

小贴士

导入浏览器 Cookie

通过导入浏览器 Cookie,可以让代理更好地访问特定网站。具体操作请参考cookies文件夹。

添加第三方工具平台 API 密钥

如果您需要从第三方工具平台(如 RapidAPI)创建工具,请订阅相关工具并运行以下命令添加 API 密钥:

python process_tool_docs.py

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
4天前
|
人工智能 自然语言处理 机器人
MCP、A2A、ACP、ANP、.... :AI智能体协议的演进展望
多家机构各自推出的MCP、A2A、ACP、ANP等AI智能体协议将会彼此竞争、互补还是趋同?前景有多种可能
96 3
MCP、A2A、ACP、ANP、.... :AI智能体协议的演进展望
|
6天前
|
人工智能 缓存 JavaScript
通义灵码深度体验:AI编程助手如何提升全栈开发效率
通义灵码是一款强大的AI编程助手,支持从代码补全到智能体自主开发的全流程辅助。在React+Node.js项目中,其实现了100%字段匹配的Mongoose Schema生成;通过`@灵码`指令,30秒内完成天气查询CLI工具开发,包含依赖管理与文档编写。其上下文记忆能力可自动关联模块逻辑,如为商品模型扩展库存校验。集成MCP服务时,不仅生成基础代码,还推荐最佳实践并添加缓存优化。测试显示,其响应速度快、复杂任务准确率高,适合中小型项目快速迭代,初期开发效率提升约40%。尽管存在文档同步延迟和TypeScript支持不足的问题,仍是一款优秀的AI编程伙伴。
45 6
|
9天前
|
人工智能 API 异构计算
AI 推理 | vLLM 快速部署指南
本文系统介绍了高性能 LLM 推理框架 vLLM 的部署实践,涵盖环境准备、GPU/CPU 后端配置、离线推理与在线推理部署等环节。最后通过实际测试,深入比较了两种后端在推理吞吐量和响应速度方面的性能差异
129 23
AI 推理 | vLLM 快速部署指南
|
5天前
|
人工智能 自然语言处理 安全
HarmonyOS NEXT+AI打造智能助手APP(适配DeepSeek)
华为仓颉编程语言与HarmonyOS NEXT结合AI大模型,开创智能助手APP开发新纪元。仓颉语言以自然化编程降低门槛,HarmonyOS NEXT提供流畅安全的系统支持,AI大模型赋予助手强大交互能力。实战课程覆盖智能对话、写作、画图等6大核心业务,模块化开发助你掌握全流程技能。参考资料及开源教程助力学习,开启智能应用开发新篇章。
48 10
HarmonyOS NEXT+AI打造智能助手APP(适配DeepSeek)
|
9天前
|
人工智能 开发者 Python
AI编码与构造智能体初学过程的反思
本文记录了作者在阿里云 AI Clouder 认证课程《基于通义灵码实现高效AI编码》学习初期的真实经历与反思。起初,作者选择从“无代码”方向的大模型课程《基于百炼平台构建智能体应用》入手,希望借助便捷工具跳过编程基础,但实践中发现效果有限,最终决定回归系统性学习路径,重新从《通义灵码》课程开始夯实技能。 文章回顾了作者的学习动机、选课逻辑、实战中遇到的问题及解决策略,并分享了关于复习方法、实践重要性和持续学习理念的深刻体会。通过这一过程,作者认识到:真正的技术掌握离不开扎实的基础和持续的练习,只有遵循客观学习规律,才能在AI开发道路上走得更远。
81 20
|
8天前
|
人工智能 小程序 API
【一步步开发AI运动APP】九、自定义姿态动作识别检测——之关键点追踪
本文介绍了【一步步开发AI运动APP】系列中的关键点追踪技术。此前分享的系列博文助力开发者打造了多种AI健身场景的小程序,而新系列将聚焦性能更优的AI运动APP开发。文章重点讲解了“关键点位变化追踪”能力,适用于动态运动(如跳跃)分析,弥补了静态姿态检测的不足。通过`pose-calc`插件,开发者可设置关键点(如鼻子)、追踪方向(X或Y轴)及变化幅度。示例代码展示了如何在`uni-app`框架中使用`createPointTracker`实现关键点追踪,并结合人体识别结果完成动态分析。具体实现可参考文档与Demo示例。
|
8天前
|
人工智能 弹性计算 智能设计
🎨 三步打造AI创意工坊 | 通义万相图像生成服务极速部署指南
🚀 从零到大师 | 通义万相智能创作系统部署指南
|
5天前
|
人工智能 开发框架 前端开发
斩获3K+ star,再见传统开发!这款开源AI后台开发框架让效率提升300%
ruoyi-ai 是基于 ruoyi-plus 框架开发的开源 AI 平台,集成 ChatGPT4、DALL·E-3 和 MidJourney 等前沿模型,提供聊天、绘画、语音克隆等全栈式 AI 能力。其核心价值在于多模态交互与企业级部署支持,开发者可快速搭建智能应用,个人用户亦能轻松体验 AI 创作魅力。项目支持自定义知识库训练、AI 绘画生成、语音克隆、弹幕互动等功能,采用 Java17+SpringBoot3.X 技术栈,前后端分离设计,具备高效性能与扩展性。相比同类项目,ruoyi-ai 提供更丰富的功能组合和企业级管理能力,适用于多种场景需求。
|
12天前
|
人工智能 数据挖掘 大数据
“龟速”到“光速”?算力如何加速 AI 应用进入“快车道”
阿里云将联合英特尔、蚂蚁数字科技专家,带来“云端进化论”特别直播。
52 11
|
26天前
|
开发框架 人工智能 Java
破茧成蝶:传统J2EE应用无缝升级AI原生
本文探讨了技术挑战和解决方案,还提供了具体的实施步骤,旨在帮助企业顺利实现从传统应用到智能应用的过渡。
破茧成蝶:传统J2EE应用无缝升级AI原生

热门文章

最新文章