ModelScope-Agent,助力每一位开发者搭建AI智能体

简介: ModelScope-Agent,助力每一位开发者搭建AI智能体


今天,阿里云牵头建设的AI模型社区魔搭(ModelScope)又上新了,推出适配开源大语言模型(LLM)的AI Agent开发框架ModelScope-Agent


借助ModelScope-Agent,所有开发者都可基于开源 LLM 搭建属于自己的智能体应用,最大限度释放想象力和创造力。ModelScope-Agent的代码现已开源。


AI Agent(AI智能体、AI代理)可谓当前大模型领域最热门的研究方向,它是指基于LLM的、能够使用工具自主完成特定任务的智能体。


众所周知,目前阶段的LLM存在能力边界,主要擅长处理文本任务。AI Agent将LLM与其他模型、软件等外部工具协同,便能处理真实世界中的各种复杂任务,比如接入视频生成模型,自主生产视频;接入外部软件,帮人类写邮件、订票、购物等等。


AI Agent类应用正在成为大模型创业的重要赛道,AI Agent 开发框架也应运而生。但业界现有的AI Agent 开发框架大多基于闭源 LLM 构建。为了充分释放开源 LLM 的生产力,魔搭社区自研了适配开源 LLM 的AI Agent开发框架ModelScope-Agent。简而言之,ModelScope-Agent是pilot(领航员)而非copilot(副驾驶员)。


此前,魔搭已用这套框架在社区做了“打样”,搭建 ModeScopeGPT,它能通过自然语言与用户交互、接受用户指令,通过“中枢模型”通义千问调用社区的众多AI模型API,自主完成人类布置的任务。ModeScopeGPT的调用量已超过 25 万。


(ModelScope-Agent系统架构图)


AI Agent的工作流程一般包括任务的理解、规划和执行,其中,LLM 负责任务规划、工具调用以及回复生成,是整个流程的智能中枢,好比人类的大脑。


ModelScope-Agent允许开发者自由选择智能体的“大脑”,适配百川、通义千问等各类开源模型。主流LLM能够做到“即插即用”,开发者如需专门训练LLM 以增强其工具调用能力,可以参考ModelScope-Agent开源的训练数据、训练方法、优化方案、评估方法。


ModelScope-Agent开发框架还包含记忆控制、工具使用等模块,记忆控制模块支持知识检索以及 prompt (提示词)管理,工具使用模块支持工具库、工具检索、工具定制。为了增强开源大模型工具调用能力,魔搭社区还自研了一个包含60w样本的MSAgent-Bench工具调用数据集。


大多数 AI Agent 开发框架需要手动添加工具,而ModelScope-Agent 通过调用魔搭社区上开源的文本向量模型,打造API 工具检索引擎,能让AI Agent根据用户指令自动检索相关工具。如果开发者想要新增外部工具/API,只需要在ModelScope-Agent上注册工具,即可直接调用。


开源正在成为很多头部大模型玩家的选择。未来,ModelScope-Agent 会适配更多新增的开源LLM,并将推出更多基于ModelScope-Agent开发的应用,如个人助理 Agent、Story Agent、Multi-Agent等。魔搭鼓励开发者用ModelScope-Agent探索工业制造、游戏开发、智能互联等行业的应用。


魔搭社区现已聚集20多家顶尖人工智能机构贡献的1000多个开源模型,模型下载量累计突破6000万。未来,魔搭将持续通过开源开放,推进大模型的技术发展和应用落地。阿里云希望把魔搭建设成为中国最大的大模型自由市场,持续促进中国大模型生态的繁荣。




/ END /


目录
相关文章
|
6天前
|
人工智能 数据管理 API
阿里云百炼又获大奖!阿里云百炼入选 2024 最受开发者欢迎的 AI 应用开发平台榜15强
2024年最受开发者欢迎的AI应用开发平台榜单发布,阿里云百炼入选15强。持续推动AI开发者生态建设,提供开放平台、培训支持、行业解决方案,注重数据安全与合规,致力于生态合作与共赢,加速企业数智化转型。
|
12天前
|
数据采集 存储 人工智能
代理IP与AI自我进化:探索未来智能的新边界
在AI快速发展的今天,数据获取成为制约其进步的关键因素。代理IP技术通过匿名性和灵活性,帮助AI突破地域限制、绕过反爬虫机制,提升数据质量和模型训练效率,促进AI自我进化。本文通过实例和代码,探讨了代理IP在AI发展中的作用及潜在价值,强调了合理使用代理IP的重要性。
20 1
|
7天前
|
机器学习/深度学习 人工智能 UED
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是一款开源的AI虚拟试衣工具,能够智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。该工具支持半身和全身试穿模式,操作简单,适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。
88 27
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型,以Agent技术为核心,支持多种数据类型的输入与输出,具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。
83 20
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
|
7天前
|
机器学习/深度学习 Web App开发 人工智能
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
Amurex是一款开源的AI会议助手,提供实时建议、智能摘要、快速回顾关键信息等功能,帮助用户提升会议效率。本文将详细介绍Amurex的功能、技术原理以及如何运行和使用该工具。
62 18
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
|
5天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
69 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
2天前
|
人工智能 数据库 自然语言处理
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
「拥抱Data+AI」系列文章由阿里云瑶池数据库推出,基于真实客户案例,展示Data+AI行业解决方案。本文通过钉钉AI助理的实际应用,探讨如何利用阿里云Data+AI解决方案实现智能问数服务,使每个人都能拥有专属数据分析师,显著提升数据查询和分析效率。点击阅读详情。
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
|
6天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
59 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
3天前
|
机器学习/深度学习 人工智能 算法
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
Meta Motivo 是 Meta 公司推出的 AI 模型,旨在控制数字智能体的全身动作,提升元宇宙体验的真实性。该模型通过无监督强化学习算法,能够实现零样本学习、行为模仿与生成、多任务泛化等功能,适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。
23 4
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
|
14天前
|
人工智能 自然语言处理 JavaScript
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统
Agent-E 是一个基于 AutoGen 代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。它能够执行多种复杂任务,如填写表单、搜索和排序电商产品、定位网页内容等,从而提高在线效率,减少重复劳动。本文将详细介绍 Agent-E 的功能、技术原理以及如何运行该系统。
59 5
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统

热门文章

最新文章