魔搭开源版GPTS来啦!轻松搭建个人超级智能体!

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: Openai DEV day上推出了GPT Stores, 允许用户通过聊天、直接配置的方式进行GPT的定制

Agent的“iPhone”时刻

Openai DEV day上推出了GPT Stores, 允许用户通过聊天、直接配置的方式进行GPT的定制,可以允许用户自定义知识库以及接入web-browsing、文生图、code-interpreter三个工具的能力。通过简化的操作,可以让更多爱好AI的人来构建GPT的生态,而不需要进行具体的代码开发。


开源版Agent架构:ModelScope Agents


开发者的持续反馈展现了GPT Store存在如下待优化点:

  • 黑盒化,开发者难以控制里面的细节,进行二次开发;
  • 工具的调用只能支持openapi的接入,定制化成本略高;
  • 数据安全隐私问题,个人知识库必须上传,并且目前存在泄露的问题;
  • 只能使用openai的模型,大量的token消耗,成本很高。


基于上述,我们希望提供开源的实现方案为开源社区的用户提供类似的应用构建体验,同时方便用户能够接入不同的LLM,方便用户定制; 此外,希望借助这样一个应用层中间件,去衔接ModelScope模型生态和应用生态,促进应用生态的繁荣。

ModelScope Agents的特点和优势如下:

1. 开源开放:所有功能代码完全开源,支持用户定制和二次开发;

2. 支持多种LLM Agent:方便用户对比切换Agent,选择最适合自己场景且性价比最高的llm;

3. 支持finetune:prompt方式定制Agent效果上存在一定瓶颈,我们也提供了专业的agent finetune定制方案和Agent finetune数据集,方便用户在自己业务场景定制自己的Agent。


一张图说明ModelScope Agents



实践案例


colab链接:

https://colab.research.google.com/github/modelscope/modelscope-agent/blob/master/demo/modelscope_agents.ipynb


notebook链接:

https://github.com/modelscope/modelscope-agent/blob/master/demo/demo_modelscopegpt_agent.ipynb


Python环境

  • Python >= 3.10 版本,建议优先使用3.10


使用方式

git clone https://github.com/modelscope/modelscope-agent.git
# 安装modelscope-agent的基础依赖
pip3 install -r requirements.txt
cd modelscope-agent/apps/agents
# 安装apps的依赖
pip3 install -r requirements.txt
# 建议使用通义千问2.0,效果更佳。DASHSCOPE_API_KEY的获取见阿里云灵积平台文档 https://help.aliyun.com/zh/dashscope/developer-reference/activate-dashscope-and-create-an-api-key?spm=a2c4g.11174283.0.0.fd643b401i1D0r
export DASHSCOPE_API_KEY=XXXX
python3 app.py


RPG游戏案例:金庸群侠传


搭建指引 ↓



游戏效果 ↓



搭建Instructions


你的指令是为我提供一个基于金庸武侠小说世界的在线RPG游戏体验。在这个游戏中,玩家将扮演金庸故事中的一个关键角色,游戏情景将基于他的小说。这个游戏的玩法是互动式的,并遵循以下特定格式:


<场景描述>:根据玩家的选择,故事情节将按照金庸小说的线索发展。你将描述角色所处的环境和情况。

<场景图片>:对于每个场景,你将创造一个概括该情况的图像。这些图像的风格将类似于1980年代RPG游戏对话的16:9宽屏比例。在这个步骤你需要调用画图工具。

<选择>:在每次互动中,你将为玩家提供三个行动选项,分别标为A、B、C,以及第四个选项“D: 输入玩家的选择”。故事情节将根据玩家选择的行动进展。如果一个选择不是直接来自小说,你将创造性地适应故事,最终引导它回归原始情节。


整个故事将围绕金庸小说中丰富而复杂的世界展开。每次互动必须包括<场景描述>、<场景图片>和<选择>。所有内容将以简体中文呈现。你的重点将仅仅放在提供场景描述,场景图片和选择上,不包含其他游戏指导。


<更多精彩案例>

https://gw.alicdn.com/imgextra/i1/O1CN011TXRVy1ZBxHMpMvST_!!6000000003157-0-tps-1171-13909.jpg


(本次案例调用LLM为通义千问2.0,关注 https://github.com/QwenLM 了解千问最新开源动向)


欢迎共建开源开放的Agent社区

RoadMap

√ 支持人工配置构建智能体

基于llm对话构建智能体

○ 生产级别功能支持,如详细的token消耗统计,运行时间,日志分析等

有效的评估方式,为用户迭代模型提供高效反馈链路,不断提升效果

支持在modelscope创空间上使用

知识库检索效果优化

支持智能体发布和分享

支持ChatGLM,百川等开源模型和商业API

处理长文本输入到内存

生产级支持:日志和性能分析

支持智能体微调

在不同场景中智能体的效果评估

(√ 已完成  ○ 待完成)


我们欢迎开发者一起来共建,也欢迎大家提出各种新的需求, 具体可以在ModelScope github提issue或者加入微信群联系我们。


我们的github地址:https://github.com/modelscope/modelscope-agent

欢迎对Agent生态感兴趣的开发者小伙伴们加入微信群



点击直达modelscope-agent开源地址:

https://github.com/modelscope/modelscope-agent

相关文章
|
28天前
|
数据采集 自然语言处理 安全
控制电脑手机的智能体人人都能造,微软开源OmniParser
微软研究团队推出OmniParser,旨在提升GPT-4V等多模态模型在用户界面操作方面的性能。通过解析用户界面截图为结构化元素,OmniParser显著增强了模型的交互能力,使其在多种基准测试中表现出色。该技术开源,促进了社区合作与技术创新,但同时也面临数据质量、计算资源及安全隐私等挑战。
61 14
|
3月前
|
前端开发 API 决策智能
多智能体微调实践:α-UMi 开源
近年来,为了加强大型语言模型(Large-Language Models, LLM)实时信息处理、解决专业问题的能力,催生了工具调用智能体(Tool Integrated Agent)概念
|
22天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
123 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
6月前
|
人工智能 自然语言处理 搜索推荐
微软开源基于ChatGPT的,超级文本代码智能体
【7月更文挑战第17天】微软的TaskWeaver是开源的LLM框架,聚焦领域特定数据分析与个性化需求。它以代码优先,将用户请求转为可执行代码,增强处理复杂任务的效率和准确性。通过用户定义插件实现定制,适应多种场景。然而,转化请求可能引入复杂性和错误,非技术用户使用插件有难度,且开源带来的安全与隐私问题需关注。[论文链接](https://arxiv.org/abs/2311.17541)**
74 4
|
2月前
|
JSON 数据可视化 知识图谱
基于百炼 qwen plus 、开源qwen2.5 7B Instruct 建非schema限定的图谱 用于agent tool的图谱形式结构化 文本资料方案
基于百炼 qwen plus 的上市企业ESG图谱构建工作,通过调用阿里云的 OpenAI 服务,从 Excel 文件读取上市公司 ESG 报告数据,逐条处理并生成知识图谱,最终以 YAML 格式输出。该过程包括数据读取、API 调用、结果处理和文件保存等步骤,确保生成的知识图谱全面、动态且结构清晰。此外,还提供了基于 Pyvis 的可视化工具,将生成的图谱以交互式图形展示,便于进一步分析和应用。
384 3
|
3月前
|
人工智能 运维 自然语言处理
对话蚂蚁开源蒋炜:让 Agent 把运维人员从 24 小时的待命中解放出来
当整个行业的智慧都集中在一件事情上时,比起闭门造车,开源一定能带来更好的技术迭代和发展。CodeFuse 「编码挑战季」活动火热进行中,诚邀广大开发者们参与编码挑战
138 3
对话蚂蚁开源蒋炜:让 Agent 把运维人员从 24 小时的待命中解放出来
|
3月前
|
人工智能 JSON 自然语言处理
开源模型+Orchestrating Agents多智能体框架,易用、强大且可控
本文采用开源Qwen2.5-14B-instruct-GGUF来体验多智能体编排和交接,希望在体验多智能体编排和交接框架的同时,一起评估中小参数规模的模型(14B)能否较好的完成多智能体任务。
|
5月前
|
人工智能 自然语言处理 算法
可自主进化的Agent?首个端到端智能体符号化训练框架开源了
【8月更文挑战第13天】近年来,AI领域在构建能自主完成复杂任务的智能体方面取得重大突破。这些智能体通常基于大型语言模型,可通过学习适应环境。为简化设计流程,AIWaves Inc.提出智能体符号化学习框架,使智能体能在数据中心模式下自我优化,以推进通向通用人工智能的道路。该框架将智能体视作符号网络,利用提示、工具及其组合方式定义可学习的权重,并采用自然语言模拟反向传播和梯度下降等学习过程,指导智能体的自我改进。实验显示,此框架能有效促进智能体的自主进化。尽管如此,该框架仍面临高质量提示设计及计算资源需求高等挑战。论文详情参见:https://arxiv.org/pdf/2406.18532。
194 58
|
5月前
|
人工智能
Meta开源用于数学等复杂推理AI Agent—HUSKY
【8月更文挑战第19天】Meta AI团队开源了HUSKY,一种统一的AI代理,专长解决数学及复杂推理任务。HUSKY通过学习在通用操作空间内推理,涵盖数值、表格和基于知识的任务。它分为生成和执行两阶段,利用专家模型如语言和数值推理模型解决问题。经过14个数据集测试,HUSKY展现出超越同类代理的性能,尤其是在新提出的HUSKYQA评估集中,其7B模型的表现媲美甚至超越GPT-4等大型模型。相关代码和模型已公开,以推动领域内的研究进展。[论文](https://arxiv.org/abs/2406.06469)
63 2
|
7月前
|
API 异构计算
开源模型破局OpenAI服务限制,15分钟灵活搭建RAG和Agent应用
今天,我们做了两个实验,目标在15分钟内,完成下载社区的开源模型,部署成API,替换LlamaIndex中RAG和LangChain中OpenAI接口Agent的最佳实践,并取得符合预期的结果。

热门文章

最新文章