【AI大模型应用开发】【AutoGPT系列】1. 快速上手 - 运行原生AutoGPT or 利用AutoGPT框架开发自己的Agent

简介: 【AI大模型应用开发】【AutoGPT系列】1. 快速上手 - 运行原生AutoGPT or 利用AutoGPT框架开发自己的Agent
  • 大家好,我是同学小张,日常分享AI知识和实战案例
  • 欢迎 点赞 + 关注 👏,持续学习持续干货输出
  • 一起交流💬,一起进步💪。
  • 微信公众号也可搜【同学小张】 🙏

本站文章一览:


上篇文章中,我们了解了AutoGPT的概念和原理。今天,我们来学习如何上手使用AutoGPT。

AutoGPT目前好像没有了利用 pip install 来安装python包的使用方式?

文章目录

0. 环境搭建

我是Windows系统,需要使用 wsl 进行安装,Linux或者Mac直接用命令行即可。

0.1 Windows系统安装方式

(1)将AutoGPT clone到电脑WSL系统内部某个文件夹内,而不是clone到Windows系统的某个文件夹内(这个容易失败,后面2.2为此种失败的尝试)。在某个路径文件夹下执行:

git clone https://github.com/Significant-Gravitas/AutoGPT.git

(2)进入你的本地目录

cd xxx/AutoGPT

(3)找到.env.template.文件,复制一份重命名为.env文件,将API Key和Base URL代理服务地址填上。

(4)按下面图片步骤生成GitHub的access token,并填到AutoGPT的配置文件中

  • 填表,生成token

  • 粘贴token到AutoGPT的.github_acess_token文件中

(5)配置github

git config --global user.name "Your Name"
git config --global user.email "you@example.com"

如果上面GitHub设置不成功,则会出现下面的错误:

(6)执行 ./run setup,安装成功显示如下:

0.2 失败的尝试 - 如果你失败了,可以看下是否是跟我一样的方式,帮你避坑

(1)将AutoGPT clone到电脑本地:在某个路径文件夹下执行:

git clone https://github.com/Significant-Gravitas/AutoGPT.git

(2)进入你的本地目录

cd /mnt/d/GitHub/AutoGPT_ZH

(3)找到.env.template.文件,复制一份重命名为.env文件,将API Key和Base URL代理服务地址填上。

(4)执行 ./run setup

(5)可能遇到如下错误:

解决此错误:

sudo apt update
sudo apt install dos2unix
dos2unix ./run

然后重新运行 ./run setup

(6)还有错误:

1. 运行AutoGPT

(1)在 AutoGPT/autogpts/autogpt 目录下运行AutoGPT命令:

python -m autogpt
• 1

运行成功如下:

注意运行命令的目录,如果不是在该目录下,可能会出现以下错误:

(2)运行成功输入你的需求或问题后,后面的过程需要人工干预(确认一些前置条件,如限制条件、最佳实践例子,数据来源等)

(3)确认好上面的信息后,AutoGPT才开始正式工作,思考、制定计划,根据限制条件等组织答案回复给用户。最后还需要用户干预,授权执行程序,然后才能得到最终结果。

从这个运行过程,可以看到AutoGPT是半自动化的,虽然它在ChatGPT的基础上增加了独立思考和计划行动的能力,但中间仍需要人工的干预。

并且这种方法使用的是开源AutoGPT中已有的能力。AutoGPT虽然提供了一个完整的框架和可用的全功能,但它不是一个已经把各种问题解决的很好、拿来就能用的具体工具。目前来看,它更适合用来当作一个架构,让大家在此基础上开发专门解决具体问题的Agent。下面我们来看下怎样在此架构的基础上开发属于我们自己的Agent。

2. 创建并运行你自己的Agent

(1)创建一个自己的AutoGPT

./run agent create YOUR_AUTOGPT_NAME

创建成功后,在代码目录下会出现你自定义的AutoGPT目录:

(2)运行自己的AutoGPT

./ru agent start YOUR_AUTOGPT_NAME

(3)可能遇到的报错:

  • 解决方案,命令行执行下命令:
export PATH="$HOME/.local/bin:{$PATH}"

(4)再运行,首次启动会安装一些依赖

(5)成功启动后的界面

(6)打开网址,登录GitHub授权

(7)最终界面

至此,你自己的AutoGPT环境就搭建成功了,可以在此基础上定义自己的AutoGPT逻辑了。注意,上面的仅是环境和代码框架搭建成功,虽然有界面,但是并不具备大模型应用的能力,需要自己填充逻辑。

如果觉得本文对你有帮助,麻烦点个赞和关注呗 ~~~


  • 大家好,我是同学小张,日常分享AI知识和实战案例
  • 欢迎 点赞 + 关注 👏,持续学习持续干货输出
  • 一起交流💬,一起进步💪。
  • 微信公众号也可搜【同学小张】 🙏

本站文章一览:

相关文章
|
4天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
4天前
|
人工智能 文字识别 API
|
4天前
|
机器学习/深度学习 人工智能 智能设计
VisionFM:通用眼科 AI 大模型,具备眼科疾病诊断能力,展现出专家级别的准确性
VisionFM 是一个多模态多任务的视觉基础模型,专为通用眼科人工智能设计。通过预训练大量眼科图像,模型能够处理多种眼科成像模态,并在多种眼科任务中展现出专家级别的智能性和准确性。
32 4
VisionFM:通用眼科 AI 大模型,具备眼科疾病诊断能力,展现出专家级别的准确性
|
12天前
|
机器学习/深度学习 人工智能 算法
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
Meta Motivo 是 Meta 公司推出的 AI 模型,旨在控制数字智能体的全身动作,提升元宇宙体验的真实性。该模型通过无监督强化学习算法,能够实现零样本学习、行为模仿与生成、多任务泛化等功能,适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。
42 4
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
|
4天前
|
人工智能 安全 机器人
OpenAI重拾规则系统,用AI版机器人定律守护大模型安全
在人工智能领域,大语言模型(LLM)展现出强大的语言理解和生成能力,但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励(RBR)”方法,通过明确规则引导LLM行为,确保其符合人类价值观和道德准则。实验显示,RBR方法在安全性与有用性之间取得了良好平衡,F1分数达97.1。然而,规则制定和维护复杂,且难以完全捕捉语言的多样性。论文:https://arxiv.org/pdf/2411.01111。
39 13
|
2天前
|
人工智能 自然语言处理 计算机视觉
AI大模型开启智能化新时代
12月19日下午,复旦大学计算机科学技术学院第十二期“步青讲坛”在江湾校区二号交叉学科楼E1006报告厅举行。本期讲坛特别邀请了阿里巴巴集团副总裁、IEEE Fellow叶杰平教授做题为《AI大模型开启智能化新时代》的精彩技术报告。
46 4
|
3天前
|
人工智能 安全 图形学
【AI落地应用实战】篡改检测技术前沿探索——从基于检测分割到大模型
在数字化洪流席卷全球的当下,视觉内容已成为信息交流与传播的核心媒介,然而,随着PS技术和AIGC技术的飞速发展,图像篡改给视觉内容安全带来了前所未有的挑战。 本文将探讨篡改检测技术的现实挑战,分享篡改检测技术前沿和最新应用成果。
|
10天前
|
人工智能 API Windows
免费部署本地AI大语言模型聊天系统:Chatbox AI + 马斯克grok2.0大模型(简单5步实现,免费且比GPT4.0更好用)
本文介绍了如何部署本地AI大语言模型聊天系统,使用Chatbox AI客户端应用和Grok-beta大模型。通过获取API密钥、下载并安装Chatbox AI、配置模型,最终实现高效、智能的聊天体验。Grok 2大模型由马斯克X-AI发布,支持超长文本上下文理解,免费且易于使用。
44 0
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型,以Agent技术为核心,支持多种数据类型的输入与输出,具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。
119 20
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
|
15天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
108 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互