ModelScope魔搭社区发布月报 -- 25年10月

简介: 2025年10月,ModelScope密集发布多模态与大模型更新,并上线国际站、科学智能专区及AIGC工具FlowBench,加速开源生态发展。

📌 国庆假期刚过🔚,AI圈却一点没闲着🔥 DeepSeek、GLM、百灵接连上新,万亿参数、Agentic能力、高效推理全都在卷 🌀

🎨 Qwen3-VL、Hunyuan-Image 3.0、Wan2.2 Animate 多模态齐发力,视觉理解&生成全面升级📸✨

🚀 云栖大会魔搭三连发🎉:国际站🌍、科学智能专区🔬、AIGC神器 FlowBench 💻,开发者工具箱直接拉满!

🤝 还有超暖的“搭友之夜”🌙 + 开发者面基,开源社区越来越有爱❤️~一起把生态做得更好吧!


愉快的“漫长”国庆假期过去了,然而对于模型的发展和迭代而言,似乎没有假期和停歇:除了节前集中出货的几家头部模型以外,还有一些选手在假期期间还在悄咪咪的搞发布(这里就不点名了哈)。本月的ModelScope月报,先带着大家再回顾一下,过去一个月里开源模型社区里的进展。


首先当然是小鲸鱼DeepSeek在发布DeepSeek-V3.1-Terminus给V3.1系列划上句点之后,又迅速跟进了DeepSeek-V3.2-Exp,持续在模型架构和算法工程结合的路上进行向前的探索。和上个月的Qwen3-Next相似,这些在模型架构和推理效率方面进行联合设计的创新,对模型的高效使用和普及有着重要的意义。此外GLM-4.6模型的发布,在Agentic和工具调用等方面能力的完善,同样给开发者带来了大的惊喜。蚂蚁百灵系列,最近进行了一系列密集的开源发布,出手就是Ling-1T和Ring-1T-Preview等万亿参数规模的模型。同时社区也欢迎科大讯飞等新朋友加入模型开源的队伍,而上个月开始开源的美团龙猫,本月也更新了LongCat-Flash的Thinking版本。除了基础模型之外,一些垂直领域的模型的开源,也引起了了大家广泛的关注。比如Tonyi-DeepResearch模型的发布,在DeepResearch领域追赶并超越了众多闭源模型以及解决方案。


多模态方面,全网关注的Qwen-VL系列,终于在节前为我们带来了全新的Qwen3-VL升级,开源视觉理解模型能力又上新台阶。在视觉生成方面,Hunyuan-Image发布了3.0版本,模型规模直接打到80B,带来了效果大幅度提升。同时Wan2.2系列则推出了新的Animate版本。此外,Qwen3-Omni在全模态方面又往前走了一步,期望这方面的探索能带来模型在多方面能力的互补。

平台建设方面,在刚刚过去的云栖大会上,我们推出了3连发发布:首先为了更好支持海外的用户,魔搭的国际站版本(modelscope.ai)正式发布,欢迎来自国内和国外的开发者都使用反馈;此外通过科学智能专区(modelscope.cn/nexa)的建设,社区和广大科学领域的研究者联手,共同探索AI在科学领域的潜力;最后面向AIGC创作者的客户端工具FlowBench正式版本也对外推出,支持本地和云上模型服务的联动,解锁更多生成式模型与工作流的玩法。当然除了一系列的发布,在云栖大会上,我们也与众多的开发者在展区和专场中,进行了热烈而愉快的面基交流,同时首届在露天举办的“没有天花板的”搭友之夜也完满收官。我们听到了来自更多开发者真实的反馈和期望,也希望和大家一起,把社区建设得更好。


· 站点更新

    1. 魔搭国际站(modelscope.ai)正式发布                                      

   


2. ModelScope FlowBench客户端正式版发布:https://www.modelscope.cn/learn/1426

   


3. AIGC专区上新

  • Qwen-Image系列支持ControlNet生图                                    


  • AIGC专区训练流程,支持用户绑定云资源进行付费训练


  • 支持Qwen-Image-Edit-v2509多图编辑推理


    4. MCP支持鉴权选项。        


    5. SwingDeploy模型部署样式更新

   


6. SwingDeploy部署支持自动推荐部署使用的推理引擎、机型以及对应服务

   

7. 社区各处用户昵称展示优化

 

8. 科学智能专区发布 https://modelscope.cn/nexa/

 


 9. 魔搭(杭州)开发者中心落成,欢迎广大开发者来玩!      



· 开源SDK与工具链更新

    1. SWIFT 3.9.0 版本发布。

  • Megatron-SWIFT提供了支持主流模型的支持,包括Qwen3-VL, Qwen3-Omni, Qwen3-Next, Kimi-VL, InternVL3.5-HF等。支持了KTO训练以及RM训练。提供对序列分类模型的支持,涵盖regression、single_label_classification、multi_label_classification等任务。添加VPP并行支持,并支持异构PP。
  • 通过ulysses 和 ring-attention 混合的序列并行优化,支持更长的序列处理能力。纯文本及多模态模型Embedding/Reranker/序列分类任务训练支持使用 padding_free ,同时完成了Embedding和Reranker训练数据集格式重构。添加Reranker和序列分类任务的推理/部署支持。
  • GRPO支持CHORD算法,实现在GRPO训练中混合SFT。GRPO训练中padding_free重构,更好支持多模态模型。 KTO支持padding free和packing以节约显存资源并加速训练
  • 新模型支持方面,持续添加对于新发布模型等支持,包括Qwen3-Next-80B-A3B-Instruct,GLM-4.6,Ling-mini-2.0/Ring-mini-2.0,Tongyi-DeepResearch-30B-A3B,ERNIE-4.5-21B-A3B-Thinking等LLM,以及Qwen3-VL-30B-A3B-Instruct,Qwen3-Omni-30B-A3B-Instruct,/Keye-VL-1_5-8B,InternVL3_5,Step-Audio-2-mini等多模态大模型。

    2. EvalScope发布1.1版本。支持在沙箱环境中运行代码评测benchmark(通过安装ms-enclave)。支持包括OCRBench, OCRBench-v2, DocVQA, InfoVQA, ChartQA, BLINK 在内的多个图文多模态评测基准。编写Qwen3-Omni和Qwen3-VL模型评测最佳实践。 对于项目依赖管理,切换为使用pyproject.toml安装。

    3. ModelScope主库1.31版本发布。 支持 AIGC 模型“官方标签”的配置,修复从hub加载tokenizer所需文件列表的问题。完善对model_revision 检查的超时逻辑,并更新了ms-swift docker构建的流程。

    4. ms-agent: DeepResearch支持多模态带图标的报告生成,并对格式错误自动修正等功能进行完善。完整版workflo支持了human feedback,递归搜索,异步调用等新能力。memory管理支持历史msg编辑能力,memory分级存储功能支持中。提供对于Claude4.5模型的支持。

    5. DiffSynth:支持Qwen-Image distill ,Qwen-Image-Edit-2509 多图编辑等模型以及新功能。Wan 2.2-VACE-Fun以及Wan2.2-Animate 模型接入完成。FlowBench的DiffySynth-Studio节点包开发完成。针对电商海报场景的分区控制模型Qwen-Image-EliGen-Poster完成训练并开源发布。

目录
相关文章
|
6月前
|
人工智能 资源调度 数据可视化
ModelScope魔搭25年7月发布月报
七月流火,这个夏天火热的开场已然揭开。6月30号,我们在北京举办了首届魔搭开发者大会(ModelScope DevCon 2025),邀请了国内外知名的开源模型,以及头部开源工具的研发团队,与广大开发者共聚一堂进行分享。顶尖的AI 模型首次从线上 Hub走进线下盛会,为大家呈现了一场“模型全明星”盛会。同时我们还邀请了社区开发者参加我们的“搭友之夜”(aka 大规模面基大会)。大会分享场场爆满,现场只能用一句话来描述:“好~多~人~啊”,不提前占位根本挤不进去~~
422 3
|
4月前
|
人工智能 物联网 API
ModelScope魔搭25年9月发布月报
ModelScope魔搭25年9月发布月报
524 10
|
5月前
|
人工智能 物联网 API
ModelScope魔搭25年8月发布月报
🔥 这个夏天,开源热潮比气温更燃!Qwen3、GLM4.5、混元、Wan2.2、Qwen-Image等重磅模型密集发布,MoE、多模态、Agent、生图视频全爆发,ModelScope 全程 Day0 支持,生态持续进化中!
453 0
|
7月前
|
人工智能 移动开发 物联网
ModelScope魔搭25年6月发布月报
从2022年11月的青涩发布,魔搭现今已进入第三个年头,成为中国最大最活跃的开源模型社区,与超过1600万的开发者同行。
360 6
|
8月前
|
开发框架 人工智能 安全
ModelScope魔搭25年5月发布月报
不知不觉间,日历已经翻过了立夏,而开源模型的世界中似乎并没有春夏秋冬。在刚刚过去的四月份,见证了开源社区又一次蓬勃发展的浪潮。以Qwen3家族为代表,一系列新模型的开源为整个生态注入了新的活力。通过全面覆盖多种规格的 dense 与 MoE 模型架构,Qwen3 首次在开源模型中引入“快思考与慢思考” 双模式的支持,获得了广大开发者的热烈欢迎,成为新一代开源大模型的标杆之作。
325 10
|
10月前
|
存储 人工智能 数据可视化
ModelScope魔搭25年3月发布月报
在这个春天里,小鲸鱼的DeepSeek-R1系列在模型社区掀起的巨大浪潮尚未平息,我们又迎来了千问的QwQ-32B正式版本,社区在Reasoning模型上的热情还在升温。除此之外,业界其他模型在过去一
296 1
|
11月前
|
编解码 API 开发工具
ModelScope魔搭25年2月版本发布月报
新春佳节的鞭炮声已经渐渐远去,在刚刚过去的一个月里,小鲸鱼给全球的开发者带来了一个不平凡的春节。DeepSeek-R1一系列开源模型的发布,给大家带来了惊喜和震动。所有人的热情,也给ModelScope社区带来了前所未见的巨大下载需求和流量,在这个月里,我们进行了数次紧急扩容和线上优化,尽量为大家提供更好的支持与服务。非常感谢大家的陪伴和理解,我们会持续进行平台优化和开源工具的建设,服务好整个开源社区。
426 9
|
存储 IDE 开发工具
ModelScope魔搭25年1月版本发布月报
随着2025年帷幕的缓缓拉开,ModelScope团队怀着新年新气象的美好期许,为广大开发者带来了1月份的重磅更新。
560 13
|
人工智能 API 开发工具
ModelScope魔搭12月版本发布月报
为了给开发者提供更便捷的开源模型API访问方式,我们正式启动了 ModelScope API-Inference 的公测。在开源工具链方面,我们进行了ModelScope 1.21.0的新版本发布,提供了llamafile的集成以及模型加载/下载链路的优化,SWIFT 3.0大版本也已经合并主干,在这个基础上新模型的支持会更加顺畅与便利。
575 3
ModelScope魔搭12月版本发布月报
|
存储 数据可视化 API
ModelScope魔搭11月版本发布月报
ModelScope 11月更新来袭!本次更新依然是干货满满的一期。

热门文章

最新文章