ModelScope-Agent,助力每一位开发者搭建AI智能体

简介: ModelScope-Agent,助力每一位开发者搭建AI智能体


今天,阿里云牵头建设的AI模型社区魔搭(ModelScope)又上新了,推出适配开源大语言模型(LLM)的AI Agent开发框架ModelScope-Agent


借助ModelScope-Agent,所有开发者都可基于开源 LLM 搭建属于自己的智能体应用,最大限度释放想象力和创造力。ModelScope-Agent的代码现已开源。


AI Agent(AI智能体、AI代理)可谓当前大模型领域最热门的研究方向,它是指基于LLM的、能够使用工具自主完成特定任务的智能体。


众所周知,目前阶段的LLM存在能力边界,主要擅长处理文本任务。AI Agent将LLM与其他模型、软件等外部工具协同,便能处理真实世界中的各种复杂任务,比如接入视频生成模型,自主生产视频;接入外部软件,帮人类写邮件、订票、购物等等。


AI Agent类应用正在成为大模型创业的重要赛道,AI Agent 开发框架也应运而生。但业界现有的AI Agent 开发框架大多基于闭源 LLM 构建。为了充分释放开源 LLM 的生产力,魔搭社区自研了适配开源 LLM 的AI Agent开发框架ModelScope-Agent。简而言之,ModelScope-Agent是pilot(领航员)而非copilot(副驾驶员)。


此前,魔搭已用这套框架在社区做了“打样”,搭建 ModeScopeGPT,它能通过自然语言与用户交互、接受用户指令,通过“中枢模型”通义千问调用社区的众多AI模型API,自主完成人类布置的任务。ModeScopeGPT的调用量已超过 25 万。


(ModelScope-Agent系统架构图)


AI Agent的工作流程一般包括任务的理解、规划和执行,其中,LLM 负责任务规划、工具调用以及回复生成,是整个流程的智能中枢,好比人类的大脑。


ModelScope-Agent允许开发者自由选择智能体的“大脑”,适配百川、通义千问等各类开源模型。主流LLM能够做到“即插即用”,开发者如需专门训练LLM 以增强其工具调用能力,可以参考ModelScope-Agent开源的训练数据、训练方法、优化方案、评估方法。


ModelScope-Agent开发框架还包含记忆控制、工具使用等模块,记忆控制模块支持知识检索以及 prompt (提示词)管理,工具使用模块支持工具库、工具检索、工具定制。为了增强开源大模型工具调用能力,魔搭社区还自研了一个包含60w样本的MSAgent-Bench工具调用数据集。


大多数 AI Agent 开发框架需要手动添加工具,而ModelScope-Agent 通过调用魔搭社区上开源的文本向量模型,打造API 工具检索引擎,能让AI Agent根据用户指令自动检索相关工具。如果开发者想要新增外部工具/API,只需要在ModelScope-Agent上注册工具,即可直接调用。


开源正在成为很多头部大模型玩家的选择。未来,ModelScope-Agent 会适配更多新增的开源LLM,并将推出更多基于ModelScope-Agent开发的应用,如个人助理 Agent、Story Agent、Multi-Agent等。魔搭鼓励开发者用ModelScope-Agent探索工业制造、游戏开发、智能互联等行业的应用。


魔搭社区现已聚集20多家顶尖人工智能机构贡献的1000多个开源模型,模型下载量累计突破6000万。未来,魔搭将持续通过开源开放,推进大模型的技术发展和应用落地。阿里云希望把魔搭建设成为中国最大的大模型自由市场,持续促进中国大模型生态的繁荣。




/ END /


目录
相关文章
|
20天前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
598 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
12天前
|
存储 机器学习/深度学习 人工智能
云栖 2025|阿里云 Qwen3 系列领衔:AI 模型全栈突破与开发者落地指南
阿里云发布Qwen3全栈AI体系,七大模型升级、性能全球领先,开源生态稳居第一。从底层基建到开发工具链全面优化,助力企业高效落地AI应用,共建超级AI云生态。
437 11
|
10天前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
阿里云 Qwen3 全栈 AI 模型:技术解析、开发者实操指南与 100 万企业落地案例
阿里云发布Qwen3全栈AI体系,推出Qwen3-Max、Qwen3-Next等七大模型,性能全球领先,开源生态超6亿次下载。支持百万级上下文、多模态理解,训练成本降90%,助力企业高效落地AI。覆盖制造、金融、创作等场景,提供无代码与代码级开发工具,共建超级AI云生态。
185 6
|
18天前
|
人工智能 编解码 自然语言处理
重磅更新!ModelScope FlowBench 支持视频生成 + 图像编辑,AI创作全面升级!
很高兴地向大家宣布,ModelScope FlowBench 客户端迎来重大功能升级! 本次更新不仅正式支持了视频节点功能,还新增了图像编辑与IC-Light智能打光等实用功能,同时对多个图像处理节点进行了深度优化和扩展。现在,您只需在 FlowBench 中轻松串联节点,即可使用 Wan2.1/Wan2.2、Qwen-Image-Edit、FLUX Kontext、IC-Light等强大模型,轻松实现创意内容的生成与编辑。 无论你是内容创作者、视觉设计师,还是AI技术爱好者,这次更新都将为你打开全新的创作边界。
288 14
|
3月前
|
人工智能 程序员 API
Anthropic Cookbook:开发者可以参考的Claude AI高效开发指南
作为配套资源的Anthropic Cookbook开源项目,更是凭借其丰富的代码示例和实用指南,在GitHub上获得了18k+颗星的高度认可。
114 7
Anthropic Cookbook:开发者可以参考的Claude AI高效开发指南
|
2月前
|
人工智能 自然语言处理 Java
面向 Java 开发者:2024 最新技术栈下 Java 与 AI/ML 融合的实操详尽指南
Java与AI/ML融合实践指南:2024技术栈实战 本文提供了Java与AI/ML融合的实操指南,基于2024年最新技术栈(Java 21、DJL 0.27.0、Spring Boot 3.2等)。主要内容包括: 环境配置:详细说明Java 21、Maven依赖和核心技术组件的安装步骤 图像分类服务:通过Spring Boot集成ResNet-50模型,实现REST接口图像分类功能 智能问答系统:展示基于RAG架构的文档处理与向量检索实现 性能优化:利用虚拟线程、GraalVM等新技术提升AI服务性能 文
195 0
|
4月前
|
人工智能 缓存 搜索推荐
手把手基于ModelScope MCP协议实现AI短视频创作:零代码自动化工作流
本文介绍了基于ModelScope MCP协议的AI视频生成解决方案,涵盖核心机制解析、零代码工作流搭建、性能优化策略及全链路异常处理。通过统一上下文描述符抽象异构AI服务,实现图像生成、语音合成与视频剪辑的自动化编排。结合缓存优化与错误重试机制,大幅提升生成效率(如5分镜视频从91.7s降至22.4s)。最后展示《夏日海滩》生成案例,并探讨个性化风格迁移与商业场景集成等进阶方向,揭示零代码本质为服务、流程与资源的三层抽象。
554 18
|
4月前
|
人工智能 Serverless API
TaskingA在GitHub上已突破 5.1k stars!这是一个真正被开发者认可的 AI Agent平台,AI开发者必看,如何用它实现生产力逆袭?
TaskingAI 是一个 AI-native 应用开发平台,通过整合模型、检索、助手与工具模块,为开发者提供一站式的 BaaS(后端即服务)体验,简化 AI 应用从开发、测试、到部署的全过程 。
103 5
|
4月前
|
SQL 人工智能 自然语言处理
通义灵码2.5 | 一个更懂开发者的 AI 编程助手
通义灵码2.5版是一款强大的AI编程助手,具备智能体模式,支持自主决策、环境感知与工具使用等功能。通过工程检索、文件编辑和终端操作,可端到端完成编码任务,并深度适配Qwen3模型,大幅提升开发效率。新版新增行间建议预测、上下文分析及记忆功能,更懂开发者需求。智能体结合MCP工具,能实现从代码生成到部署的全流程自动化,如文中实例展示的数独小游戏开发与在线部署。无论是日常开发还是创意实现,通义灵码都能显著提升工作效率与能力边界。
|
5月前
|
人工智能 自然语言处理 安全
💻 Codex 来了:OpenAI 推出多任务软件工程 AI 代理,开发者工作方式将被重塑?
Codex 是 OpenAI 推出的一款云端智能开发代理,基于优化后的 Codex-1 模型,能够执行从代码编写、Bug 修复到 PR 提交的完整工程任务。通过 ChatGPT 的界面,用户可向 Codex 分配任务,它将在独立沙盒中运行并返回结果。Codex 支持多任务异步处理,遵循项目规范(AGENTS.md),并生成日志与测试报告以确保透明性。作为“AI 参与式开发”的里程碑,Codex 不仅提升效率,还可能重塑开发者角色,使他们从具体编码转向指导 AI 完成任务,推动软件工程进入意图驱动的新时代。
351 16