ModelScope魔搭25年6月发布月报

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 从2022年11月的青涩发布,魔搭现今已进入第三个年头,成为中国最大最活跃的开源模型社区,与超过1600万的开发者同行。

叮叮叮!从2022年11月的青涩发布,魔搭现今已进入第三个年头,成为中国最大最活跃的开源模型社区,与超过1600万的开发者同行。上个月我们在杭州举办了“搭友来碰头”的核心开发者共创会,本月底,我们将在北京·海淀香格里拉饭店举办首届魔搭开发者大会(ModelScope DevCon 2025)诚邀广大开发者与我们在6月30号欢聚北京,共建开源技术生态!

 

过去一个月,社区依然保持活跃发展态势。我们迎来了DeepSeek-R1的一个“小更新”,Qwen也补齐了开源序列中的Embedding和Rerank模型。小米 MiMo 开源系列新增了 MiMo-VL 模型。而来自字节 Seed 系列的开源项目迎来一波发布浪潮,包括Seed-Coder,SeedVR以及在多模态模型结构方面进一步创新探索的 BAGEL 模型。来自面壁的MiniCPM小钢炮更新到了4.0版本,进一步探索端侧智能的极限。mistralAI,小红书hilabs,腾讯混元,通义万相……无论是业界熟悉的团队,还是新晋AI研究力量,都在过去一个月中活跃于社区,并贡献了多个最新开源模型。

 

在平台建设方面,ModelScope 站点已完成对各主要板块的页面样式、排版及字体的整体重构升级,同时优化了开发者暗黑模式的展示效果,旨在为 AI 开发者提供更符合使用习惯的浏览体验。MCP广场提供了开发者自主贡献MCP Server的链路,以更开放的姿势,拥抱开源模型与MCP的联合生态。同时,MCP 广场的 OpenAPI 接口文档已正式发布,便于更多工具和生态体系实现灵活集成。ModelScope 的 MCP 实验场功能已通过 ModelScope-Agent 项目实现开源。围绕以 MCP 为代表的工具生态需求,ModelScope-Agent 目前也正经历全面重构与功能升级。在平台多元素间的血缘关联方面,我们优化了论文板块与模型等元素的自动关联机制,让广大学术范的开发者,可以在平台上直接完成从模型到模型技术报告/论文的全闭环✌️。在AIGC专区,过去一个月我们进一步完善了视频生成能力的支持体系,在扩展模型规格的同时,新增了图生视频、首尾帧生视频等功能,为社区开源模型的标杆视频生成能力,实现了服务化和外化,期望开发者能够通过这些模型服务能力,更快的上手体验模型能力。

 

· 站点更新

1. 站点主要板块排版/字体等更新重构,希望在为广大开发者保障页面信息密度的同时,确保视觉浏览上的舒适度

image.gif


image.gif

 

2. MCP开放生态建设

  • 开放MCP server的开发者自主贡献链路,更积极的拥抱MCP与开源模型的联合生态。

image.gif

 

image.gif

image.gif

 

  • 上线 ModelScope MCP OpenAPI,提供诸多API方便三方开发者在不同应用中集成ModelScope MCP广场

image.gif

  • ModelScope的MCP-实验场的实现改版,并通过我们的ModelScope-Agent项目完成了开源。

image.gif

3. Hosted MCP连接时支持设置有效期。

image.gif

4. MCP服务详情页增加交流反馈区,方便社区用户向MCP所有者提交问题与讨论。

image.gif

5. AIGC专区

  • 视频生成模块,添加了基于通义万相Wan2.1-14B的一系列新功能,包括图生视频,首尾帧生视频等。同时针对Wan2.1-14B模型,同时提供文生视频以及LoRA训练等全系列能力。

image.gif

image.gif

  • AIGC推理链路中,模型下载支持异步化来加速整体推理速度,同时视频生成推理引擎端的加速优化发布。
  • AIGC模型转载提示上线

image.gif

6. 论文与模型/数据集等其他元素的自动双向血缘关联发布,支持社区上模型研究与学习氛围的进一步推进。同时对论文的搜索,支持了基于arxiv id的精确搜索。

image.gif 编辑 image.gif 编辑
image.gif 编辑

 

image.gif 编辑

 

7. ModelScope国际站(modelscope.ai)在移动端H5上线,国际站整体的内容以及文案持续优化中。

image.gif

8. SwingDeploy链路体验改进上线。

image.gif

9. 全局搜索展示优化,并覆盖MCP等更完整多数据源

image.gif

10. 模型关联内容展示种类切换模式,修改为tab样式。

image.gif

 

· 开源SDK与工具链更新

1. SWIFT 3.5.0 版本发布。

  • GRPO功能完善:包括完成针对长文本训练优化,并添加ulysses序列并行的支持;对vLLM做了更完善的支持,包括对v1 engine原生的支持以及外部vLLM服务器的对接;添加liger kernel loss的支持;对于自定义采样的批量配置,提供更细化的参数配置。
  • 训练功能方面:对于CPT/SFT/DPO/GRPO模式下,支持padding free的训练;对多模态模型的训练,对于不同模块的LR以及gradient checkpoint等参数,支持对立配置;CPT/SFT支持对不同channel数据集独立统计loss,以及use_logits_to_keep等参数;对于Qwen2.5-VL/Omni模型支持输入图像目录进行训练。
  • Megatron-SWFIT: 支持通过max-epochs自动控制训练轮数并添加了megatron参数的直接透传。
  • 新模型支持:添加对DeepSeek-R1-0528,Qwen3-embedding,Qwen-Long,MiMo-VL,MiniCPM4等模型的支持。

2. EvalScope更新到0.16.1。

  • 支持Needle-in-a-Haystack测试, DocMath和FRAMES长文档评测,以及配置测试数据集百分比等功能。

image.gif

  • 支持模型服务性能压测支持设置多种并发,并输出格式化性能压测报告:

image.gif

  • 支持ToolBench-Static数据集评测模型的工具调用能力,DROP和Winogrande评测模型的推理能力。支持use_cache重用评测结果

3. 主库1.27版本发布。新版添加了scan-cache功能,方便对本地下载cache文件的梳理。支持模型无需提前单独创建,通过命令行直接上传(默认直接创建)。ModelScope 命令行运行环境添加ASCII logo 😆。放松单repo支持文件数到5w。

image.gif

4. modelscope-agent: 完成了对于MCP工具生态的支持,并作为MCP广场实验场的实现底座。更多针对负责Agent场景的全面重构和功能升级进行中。

5. DiffSynth:推理 pipeline 和训练框架重构中,Wan/VACE/Fun1.1等模型同步进行中。Nexus-Gen模型更新版本,大幅提升图像生成的文本提示鲁棒性。

 

魔搭开发者大会 | 邀请函

首届魔搭开发者大会 预热提前报名通道开启 🎉🎉🎉

200余位顶级学者专家,数万名AI开发者们齐聚

早鸟票已开启,就等你来!点击阅读原文,即可报名~

image.gif

 

https://modelscope.cn/DevCon2025

目录
相关文章
|
25天前
|
人工智能 开发者
2025魔搭开发者大会!来了!
2025魔搭开发者大会!来了!
698 1
|
22天前
|
缓存 自然语言处理 监控
基于通义大模型的智能客服系统构建实战:从模型微调到API部署
本文详细解析了基于通义大模型的智能客服系统构建全流程,涵盖数据准备、模型微调、性能优化及API部署等关键环节。通过实战案例与代码演示,展示了如何针对客服场景优化训练数据、高效微调大模型、解决部署中的延迟与并发问题,以及构建完整的API服务与监控体系。文章还探讨了性能优化进阶技术,如模型量化压缩和缓存策略,并提供了安全与合规实践建议。最终总结显示,微调后模型意图识别准确率提升14.3%,QPS从12.3提升至86.7,延迟降低74%。
224 14
|
27天前
|
传感器 监控 算法
从开源代码入场无人机学术研究到商业化市场的全路径指南-优雅草卓伊凡
从开源代码入场无人机学术研究到商业化市场的全路径指南-优雅草卓伊凡
99 4
从开源代码入场无人机学术研究到商业化市场的全路径指南-优雅草卓伊凡
|
2月前
|
人工智能 编解码 API
搭友来碰头|魔搭核心开发者共创会精彩回顾
周五,首期"搭友来碰头"——魔搭核心开发者共创会在 [杭州·阿里巴巴云谷园区] 圆满落幕。来自杭州、上海、南京、北京等各地的魔搭社区核心开发者齐聚一堂,共同探索从模型开源到技术突破的转化路径。
116 11
|
27天前
|
机器学习/深度学习 数据采集 人工智能
WebDancer:从零训练一个 DeepResearch 类智能体
WebDancer 是一款具备 Agentic 能力的智能体,能在开放网页环境中自主提问、搜索、推理并验证答案。它通过多步推理、信息整合与交叉验证解决复杂问题,如医学文献分析或政策追踪。WebDancer 采用 CRAWLQA 和 E2HQA 数据合成策略生成高质量训练数据,并结合 SFT(监督微调)+ RL(强化学习)双阶段训练方法,提升模型在动态环境中的适应性和泛化能力。其核心技术包括 ReAct 行为框架和 DAPO 强化学习算法,确保路径优化与策略稳定性。未来,WebDancer 将接入 Browser 工具链,拓展至代码沙盒、长文本写作等应用场景,进一步向通用智能体演进。
514 27
|
11月前
|
机器学习/深度学习 自然语言处理 监控
|
24天前
|
人工智能 自然语言处理 运维
AI agent跨平台云资源智能管理终端是什么
随着多云架构和混合IT环境的普及,企业面临跨平台资源协同效率低、操作复杂等问题。为此,跨平台云资源智能管理终端应运而生。它通过模块化架构与自动化引擎,将异构云环境中的资源统一管理,并提供对话式交互、批量操作与智能策略编排能力。典型产品如Chaterm,支持自然语言指令输入,实现从任务规划到执行反馈的闭环体验。其应用场景涵盖大规模服务器集群管理、跨云资源调度、复杂环境自动化配置等,显著提升效率与可靠性。实施时需关注兼容性、扩展性及安全性,建议从试点入手逐步推广,优化企业运维流程。
74 5
|
27天前
|
SQL 人工智能 Java
阿里云百炼开源面向 Java 开发者的 NL2SQL 智能体框架
Spring-ai-alibaba-nl2sql 是析言 GBI 产品在数据问答领域的一次重要开源尝试,专注于 NL2SQL 场景下的核心能力开放。
430 48
|
1月前
|
开发框架 定位技术 API
AgentScope 与 MCP:实践、思考与展望
AgentScope 作为一款功能强大的开源多智能体开发框架,为开发者提供了智能体构建、工具使用、多智能体编排等全方位支持。
295 37

热门文章

最新文章