备案控制台

开发者社区开发与运维文章正文

【AI大模型应用开发】【AutoGPT系列】1. 快速上手 - 运行原生AutoGPT or 利用AutoGPT框架开发自己的Agent

2024-04-23 283

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【AI大模型应用开发】【AutoGPT系列】1. 快速上手 - 运行原生AutoGPT or 利用AutoGPT框架开发自己的Agent

大家好，我是同学小张，日常分享AI知识和实战案例

欢迎 点赞 + 关注 👏，持续学习，持续干货输出。

一起交流💬，一起进步💪。

微信公众号也可搜【同学小张】 🙏

本站文章一览：

在上篇文章中，我们了解了AutoGPT的概念和原理。今天，我们来学习如何上手使用AutoGPT。

AutoGPT目前好像没有了利用 pip install 来安装python包的使用方式？

文章目录

0. 环境搭建

0. 环境搭建

我是Windows系统，需要使用 wsl 进行安装，Linux或者Mac直接用命令行即可。

0.1 Windows系统安装方式

（1）将AutoGPT clone到电脑WSL系统内部某个文件夹内，而不是clone到Windows系统的某个文件夹内（这个容易失败，后面2.2为此种失败的尝试）。在某个路径文件夹下执行：

git clone https://github.com/Significant-Gravitas/AutoGPT.git

（2）进入你的本地目录

cd xxx/AutoGPT

（3）找到.env.template.文件，复制一份重命名为.env文件，将API Key和Base URL代理服务地址填上。

（4）按下面图片步骤生成GitHub的access token，并填到AutoGPT的配置文件中

进入 https://github.com/settings/tokens 网页

填表，生成token

粘贴token到AutoGPT的.github_acess_token文件中

（5）配置github

git config --global user.name "Your Name"
git config --global user.email "you@example.com"

如果上面GitHub设置不成功，则会出现下面的错误：

（6）执行 ./run setup，安装成功显示如下：

0.2 失败的尝试 - 如果你失败了，可以看下是否是跟我一样的方式，帮你避坑

（1）将AutoGPT clone到电脑本地：在某个路径文件夹下执行：

git clone https://github.com/Significant-Gravitas/AutoGPT.git

（2）进入你的本地目录

cd /mnt/d/GitHub/AutoGPT_ZH

（3）找到.env.template.文件，复制一份重命名为.env文件，将API Key和Base URL代理服务地址填上。

（4）执行 ./run setup

（5）可能遇到如下错误：

解决此错误：

sudo apt update
sudo apt install dos2unix
dos2unix ./run

然后重新运行 ./run setup

（6）还有错误：

1. 运行AutoGPT

（1）在 AutoGPT/autogpts/autogpt 目录下运行AutoGPT命令：

python -m autogpt
• 1

运行成功如下：

注意运行命令的目录，如果不是在该目录下，可能会出现以下错误：

（2）运行成功输入你的需求或问题后，后面的过程需要人工干预（确认一些前置条件，如限制条件、最佳实践例子，数据来源等）

（3）确认好上面的信息后，AutoGPT才开始正式工作，思考、制定计划，根据限制条件等组织答案回复给用户。最后还需要用户干预，授权执行程序，然后才能得到最终结果。

从这个运行过程，可以看到AutoGPT是半自动化的，虽然它在ChatGPT的基础上增加了独立思考和计划行动的能力，但中间仍需要人工的干预。

并且这种方法使用的是开源AutoGPT中已有的能力。AutoGPT虽然提供了一个完整的框架和可用的全功能，但它不是一个已经把各种问题解决的很好、拿来就能用的具体工具。目前来看，它更适合用来当作一个架构，让大家在此基础上开发专门解决具体问题的Agent。下面我们来看下怎样在此架构的基础上开发属于我们自己的Agent。

2. 创建并运行你自己的Agent

（1）创建一个自己的AutoGPT

./run agent create YOUR_AUTOGPT_NAME

创建成功后，在代码目录下会出现你自定义的AutoGPT目录：

（2）运行自己的AutoGPT

./ru agent start YOUR_AUTOGPT_NAME

（3）可能遇到的报错：

解决方案，命令行执行下命令：

export PATH="$HOME/.local/bin:{$PATH}"

（4）再运行，首次启动会安装一些依赖

（5）成功启动后的界面

（6）打开网址，登录GitHub授权

（7）最终界面

至此，你自己的AutoGPT环境就搭建成功了，可以在此基础上定义自己的AutoGPT逻辑了。注意，上面的仅是环境和代码框架搭建成功，虽然有界面，但是并不具备大模型应用的能力，需要自己填充逻辑。

如果觉得本文对你有帮助，麻烦点个赞和关注呗 ~~~

大家好，我是同学小张，日常分享AI知识和实战案例

欢迎 点赞 + 关注 👏，持续学习，持续干货输出。

一起交流💬，一起进步💪。

微信公众号也可搜【同学小张】 🙏

本站文章一览：

文章标签：

人工智能

Windows

API

Python

Linux

关键词：

AI框架

AI应用开发

AI开发

AI模型

通义星尘ai

同学小张

目录

相关文章

魔搭ModelScope社区小助手

|

4天前

|

机器学习/深度学习人工智能物联网

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

12月14日，由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。

魔搭ModelScope社区小助手

101 58 60

AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营

猫林老师

|

4天前

|

人工智能文字识别 API

鸿蒙(HarmonyOS)原生AI能力之文本识别

如何实现文本识别

猫林老师

51 21 21

鸿蒙(HarmonyOS)原生AI能力之文本识别

蚝油菜花

|

4天前

|

机器学习/深度学习人工智能智能设计

VisionFM：通用眼科 AI 大模型，具备眼科疾病诊断能力，展现出专家级别的准确性

VisionFM 是一个多模态多任务的视觉基础模型，专为通用眼科人工智能设计。通过预训练大量眼科图像，模型能够处理多种眼科成像模态，并在多种眼科任务中展现出专家级别的智能性和准确性。

蚝油菜花

32 4 4

VisionFM：通用眼科 AI 大模型，具备眼科疾病诊断能力，展现出专家级别的准确性

蚝油菜花

|

12天前

|

机器学习/深度学习人工智能算法

Meta Motivo：Meta 推出能够控制数字智能体动作的 AI 模型，提升元宇宙互动体验的真实性

Meta Motivo 是 Meta 公司推出的 AI 模型，旨在控制数字智能体的全身动作，提升元宇宙体验的真实性。该模型通过无监督强化学习算法，能够实现零样本学习、行为模仿与生成、多任务泛化等功能，适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。

蚝油菜花

42 4 4

Meta Motivo：Meta 推出能够控制数字智能体动作的 AI 模型，提升元宇宙互动体验的真实性

楠竹11

|

4天前

|

人工智能安全机器人

OpenAI重拾规则系统，用AI版机器人定律守护大模型安全

在人工智能领域，大语言模型（LLM）展现出强大的语言理解和生成能力，但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励（RBR）”方法，通过明确规则引导LLM行为，确保其符合人类价值观和道德准则。实验显示，RBR方法在安全性与有用性之间取得了良好平衡，F1分数达97.1。然而，规则制定和维护复杂，且难以完全捕捉语言的多样性。论文：https://arxiv.org/pdf/2411.01111。

楠竹11

39 13 13

wdzhao

|

2天前

|

人工智能自然语言处理计算机视觉

AI大模型开启智能化新时代

12月19日下午，复旦大学计算机科学技术学院第十二期“步青讲坛”在江湾校区二号交叉学科楼E1006报告厅举行。本期讲坛特别邀请了阿里巴巴集团副总裁、IEEE Fellow叶杰平教授做题为《AI大模型开启智能化新时代》的精彩技术报告。

wdzhao

46 4 4

游客2vbblwpltjq5e

|

3天前

|

人工智能安全图形学

【AI落地应用实战】篡改检测技术前沿探索——从基于检测分割到大模型

在数字化洪流席卷全球的当下，视觉内容已成为信息交流与传播的核心媒介，然而，随着PS技术和AIGC技术的飞速发展，图像篡改给视觉内容安全带来了前所未有的挑战。本文将探讨篡改检测技术的现实挑战，分享篡改检测技术前沿和最新应用成果。

游客2vbblwpltjq5e

10 0 0

oioihoii

|

10天前

|

人工智能 API Windows

免费部署本地AI大语言模型聊天系统：Chatbox AI + 马斯克grok2.0大模型（简单5步实现，免费且比GPT4.0更好用）

本文介绍了如何部署本地AI大语言模型聊天系统，使用Chatbox AI客户端应用和Grok-beta大模型。通过获取API密钥、下载并安装Chatbox AI、配置模型，最终实现高效、智能的聊天体验。Grok 2大模型由马斯克X-AI发布，支持超长文本上下文理解，免费且易于使用。

oioihoii

44 0 0

蚝油菜花

|

15天前

|

机器学习/深度学习人工智能自然语言处理

Gemini 2.0：谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型

谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型，以Agent技术为核心，支持多种数据类型的输入与输出，具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。

蚝油菜花

119 20 20

Gemini 2.0：谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型

蚝油菜花

|

15天前

|

人工智能 API 语音技术

TEN Agent：开源的实时多模态 AI 代理框架，支持语音、文本和图像的实时通信交互

TEN Agent 是一个开源的实时多模态 AI 代理框架，集成了 OpenAI Realtime API 和 RTC 技术，支持语音、文本和图像的多模态交互，具备实时通信、模块化设计和多语言支持等功能，适用于智能客服、实时语音助手等多种场景。

蚝油菜花

108 15 15

TEN Agent：开源的实时多模态 AI 代理框架，支持语音、文本和图像的实时通信交互

热门文章

最新文章

Qwen-Agent功能调用实践探索

Proactive Agent：清华联合面壁智能开源的新一代主动Agent交互范式

基于百炼平台qwen-max的api 打造一套检索增强图谱增强基于指令的智能工具调用决策智能体

基于百炼平台qwen-max的api 打造一套检索增强图谱增强智能工具调用决策的智能体

如何构建一套qwen-max智能体拥有媲美通义千问在线接口的能力

基于agentscope的多智能体游戏场景-骗子酒馆

Director：构建视频智能体的 AI 框架，用自然语言执行搜索、编辑、合成和生成等复杂视频任务

如何构建媲美通义千问在线接口的qwen-max智能体

Agent-E：基于 AutoGen 代理框架构建的 AI 浏览器自动化系统

如何构建一套qwen-max智能体拥有媲美通义千问在线接口的能力

Fireworks AI和MongoDB：依托您的数据，借助优质模型，助力您开发高速AI应用

生成式AI入门必读：基本概念、数据挑战与解决方案

夏日主题 AI创造挑战活动来了！

[译][AI OpenAI-doc] 延迟优化

新一代数据库技术：融合AI的智能数据管理系统

AI回答总不满意？你的提问方式可能完全错误！

AI工具-标注工具labelme

[译][AI OpenAI-doc] 安全最佳实践

构建高效AI系统：深度学习优化技术解析

构建未来：AI在持续学习系统中的创新应用

相关课程

更多

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

趣味视觉AI应用入门与实战

AI数学基础

相关电子书

更多

Lindorm AI 能力介绍

2023云栖大会：PolarDB for AI

2023云栖大会：Lindorm一站式AI数据平台实战

相关实验场景

更多

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

如何快速体验调用通义大模型

使用容器计算服务 ACS 算力快速搭建生成式 AI 会话应用

SAE 极速部署专属 AI 证件照神器

流水线运行出错排查难？AI帮你智能排查

以电商场景为例搭建AI语义搜索应用

下一篇

手把手教你白嫖阿里云服务器(免费领服务器)