【AI大模型应用开发】【AutoGPT系列】1. 快速上手 - 运行原生AutoGPT or 利用AutoGPT框架开发自己的Agent

简介: 【AI大模型应用开发】【AutoGPT系列】1. 快速上手 - 运行原生AutoGPT or 利用AutoGPT框架开发自己的Agent
  • 大家好,我是同学小张,日常分享AI知识和实战案例
  • 欢迎 点赞 + 关注 👏,持续学习持续干货输出
  • 一起交流💬,一起进步💪。
  • 微信公众号也可搜【同学小张】 🙏

本站文章一览:


上篇文章中,我们了解了AutoGPT的概念和原理。今天,我们来学习如何上手使用AutoGPT。

AutoGPT目前好像没有了利用 pip install 来安装python包的使用方式?

文章目录

0. 环境搭建

我是Windows系统,需要使用 wsl 进行安装,Linux或者Mac直接用命令行即可。

0.1 Windows系统安装方式

(1)将AutoGPT clone到电脑WSL系统内部某个文件夹内,而不是clone到Windows系统的某个文件夹内(这个容易失败,后面2.2为此种失败的尝试)。在某个路径文件夹下执行:

git clone https://github.com/Significant-Gravitas/AutoGPT.git

(2)进入你的本地目录

cd xxx/AutoGPT

(3)找到.env.template.文件,复制一份重命名为.env文件,将API Key和Base URL代理服务地址填上。

(4)按下面图片步骤生成GitHub的access token,并填到AutoGPT的配置文件中

  • 填表,生成token

  • 粘贴token到AutoGPT的.github_acess_token文件中

(5)配置github

git config --global user.name "Your Name"
git config --global user.email "you@example.com"

如果上面GitHub设置不成功,则会出现下面的错误:

(6)执行 ./run setup,安装成功显示如下:

0.2 失败的尝试 - 如果你失败了,可以看下是否是跟我一样的方式,帮你避坑

(1)将AutoGPT clone到电脑本地:在某个路径文件夹下执行:

git clone https://github.com/Significant-Gravitas/AutoGPT.git

(2)进入你的本地目录

cd /mnt/d/GitHub/AutoGPT_ZH

(3)找到.env.template.文件,复制一份重命名为.env文件,将API Key和Base URL代理服务地址填上。

(4)执行 ./run setup

(5)可能遇到如下错误:

解决此错误:

sudo apt update
sudo apt install dos2unix
dos2unix ./run

然后重新运行 ./run setup

(6)还有错误:

1. 运行AutoGPT

(1)在 AutoGPT/autogpts/autogpt 目录下运行AutoGPT命令:

python -m autogpt
• 1

运行成功如下:

注意运行命令的目录,如果不是在该目录下,可能会出现以下错误:

(2)运行成功输入你的需求或问题后,后面的过程需要人工干预(确认一些前置条件,如限制条件、最佳实践例子,数据来源等)

(3)确认好上面的信息后,AutoGPT才开始正式工作,思考、制定计划,根据限制条件等组织答案回复给用户。最后还需要用户干预,授权执行程序,然后才能得到最终结果。

从这个运行过程,可以看到AutoGPT是半自动化的,虽然它在ChatGPT的基础上增加了独立思考和计划行动的能力,但中间仍需要人工的干预。

并且这种方法使用的是开源AutoGPT中已有的能力。AutoGPT虽然提供了一个完整的框架和可用的全功能,但它不是一个已经把各种问题解决的很好、拿来就能用的具体工具。目前来看,它更适合用来当作一个架构,让大家在此基础上开发专门解决具体问题的Agent。下面我们来看下怎样在此架构的基础上开发属于我们自己的Agent。

2. 创建并运行你自己的Agent

(1)创建一个自己的AutoGPT

./run agent create YOUR_AUTOGPT_NAME

创建成功后,在代码目录下会出现你自定义的AutoGPT目录:

(2)运行自己的AutoGPT

./ru agent start YOUR_AUTOGPT_NAME

(3)可能遇到的报错:

  • 解决方案,命令行执行下命令:
export PATH="$HOME/.local/bin:{$PATH}"

(4)再运行,首次启动会安装一些依赖

(5)成功启动后的界面

(6)打开网址,登录GitHub授权

(7)最终界面

至此,你自己的AutoGPT环境就搭建成功了,可以在此基础上定义自己的AutoGPT逻辑了。注意,上面的仅是环境和代码框架搭建成功,虽然有界面,但是并不具备大模型应用的能力,需要自己填充逻辑。

如果觉得本文对你有帮助,麻烦点个赞和关注呗 ~~~


  • 大家好,我是同学小张,日常分享AI知识和实战案例
  • 欢迎 点赞 + 关注 👏,持续学习持续干货输出
  • 一起交流💬,一起进步💪。
  • 微信公众号也可搜【同学小张】 🙏

本站文章一览:

相关文章
|
18天前
|
机器学习/深度学习 人工智能 算法
通义OmniAudio大模型,让 AI 看懂 360° 视频,并“听”出对应的空间音频
OmniAudio 是一项突破性的空间音频生成技术,能够直接从 360° 视频生成 FOA(First-order Ambisonics)空间音频,为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调,OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集,支持高质量的模型训练与评估。代码、数据及论文均已开源,助力沉浸式体验技术发展。
|
16天前
|
人工智能 IDE 定位技术
AI IDE正式上线!通义灵码开箱即用
通义灵码AI IDE现已正式上线,用户可免费下载使用。作为AI原生开发环境工具,它深度适配千问3大模型,集成通义灵码插件能力,支持编程智能体、行间建议预测和行间会话等功能。其核心亮点包括:支持最强开源模型千问3,具备MCP工具调用能力;开箱即用的智能编码助手;自带编程智能体模式,端到端完成编码任务;长期记忆、NES行间预测及Inline Chat功能,大幅提升编程效率。目前,通义灵码插件下载量超1500万,生成代码超30亿行,广泛应用于企业开发场景。
AI IDE正式上线!通义灵码开箱即用
|
16天前
|
人工智能 自然语言处理 测试技术
🧠 用 AI 提升你的编程效率 —— 在 PyCharm 中体验通义灵码
通义灵码是一款基于大模型的智能编程辅助工具,现已上线PyCharm插件V2.5+版本。它能根据自然语言描述、注释或上下文生成高质量代码,支持多语言(Python、Java等),提供代码补全、优化建议、单元测试生成及异常排查等功能。集成魔搭MCP市场3000+服务,具备编程智能体模式与长期记忆能力,助开发者提升效率。适用初学者、资深开发者及团队协作场景。小红书、B站、抖音、微博均有相关资源分享。 小红书: http://xhslink.com/a/SvabuxSObf3db bilibili:https://b23.tv/1HJAdIx 抖音: https://v.douyin.com/1DAG
243 3
|
16天前
|
人工智能 Java 决策智能
Spring AI Alibaba Graph:多智能体框架实践
Spring AI Alibaba 是一个面向 Java 开发者的开源人工智能框架,旨在简化 AI 应用开发。本文重点介绍其 Graph 组件,用于解决工作流与多智能体协作问题。Graph 组件通过声明式编程接口,提供统一的上下文管理、消息记忆、人工确认节点等功能,支持复杂 AI 应用的构建。
|
16天前
|
人工智能 安全 网络安全
网络安全厂商F5推出AI Gateway,化解大模型应用风险
网络安全厂商F5推出AI Gateway,化解大模型应用风险
32 0
|
7月前
|
存储 人工智能 自然语言处理
AI经营|多Agent择优生成商品标题
商品标题中关键词的好坏是商品能否被主搜检索到的关键因素,使用大模型自动优化标题成为【AI经营】中的核心能力之一,本文讲述大模型如何帮助商家优化商品素材,提升商品竞争力。
821 62
AI经营|多Agent择优生成商品标题
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型,以Agent技术为核心,支持多种数据类型的输入与输出,具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。
806 20
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
|
6月前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
497 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
6月前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
255 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
6月前
|
机器学习/深度学习 人工智能 算法
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
Meta Motivo 是 Meta 公司推出的 AI 模型,旨在控制数字智能体的全身动作,提升元宇宙体验的真实性。该模型通过无监督强化学习算法,能够实现零样本学习、行为模仿与生成、多任务泛化等功能,适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。
212 4
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性