modelscope_社区达人页

个人头像照片
modelscope
已加入开发者社区357

勋章 更多

个人头像照片
阿里博主
阿里博主
个人头像照片
江湖新秀
江湖新秀

成就

已发布377篇文章
185条评论
已回答0个问题
0条评论
已发布13个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍

暂无精选文章
暂无更多信息

2025年11月

  • 11.24 11:46:26
    发表了文章 2025-11-24 11:46:26

    AgentEvolver:让智能体系统学会「自我进化」

    AgentEvolver 是一个自进化智能体系统,通过自我任务生成、经验导航与反思归因三大机制,推动AI从“被动执行”迈向“主动学习”。它显著提升强化学习效率,在更少参数下实现更强性能,助力智能体持续自我迭代。开源地址:https://github.com/modelscope/AgentEvolver
  • 11.24 11:20:36
    发表了文章 2025-11-24 11:20:36

    Meta SAM3开源:让图像分割,听懂你的话

    Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
  • 11.21 10:02:03
    发表了文章 2025-11-21 10:02:03

    Meta SAM3开源:让图像分割,听懂你的话

    Meta发布并开源SAM 3,首个支持文本、点、框等提示进行图像与视频分割的统一基础模型,突破传统限制,实现开放词汇概念的精准识别与跟踪,涵盖超400万独特概念,推动视觉分割新发展。
  • 11.20 11:17:46
    发表了文章 2025-11-20 11:17:46

    MemOS 正式上线魔搭社区 MCP 广场,让你的智能体拥有「长期记忆」

    MemOS 正式上线魔搭社区 MCP 广场,作为首个大模型记忆操作系统,支持标准化记忆读写,7天调用量超14.9万次。开发者可一键集成,让AI具备持久化、可调度的记忆能力,实现连续思考与长期进化。
  • 11.19 09:32:23
    发表了文章 2025-11-19 09:32:23

    ModelScope魔搭社区发布月报 -- 25年11月

    魔搭ModelScope三周年庆!见证开源大模型从追赶到领跑,11月硬核更新不断:Qwen3-VL、MiniMax-M2等新模态齐发,AIGC生态爆发,OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会,不见不散!
  • 11.18 17:06:56
    发表了文章 2025-11-18 17:06:56

    码上生花:用API链接Qwen-Image系列及衍生LoRA生态模型

    Qwen-Image系列开源三月成爆款,凭借中文场景优势与ModelScope平台深度集成,支持文生图、图像编辑及LoRA生态API调用,助力开发者高效创作。
  • 11.17 09:33:28
    发表了文章 2025-11-17 09:33:28

    腾讯混元&清华开源15M高质量多模态训练数据,全面开放MLLM迎来质变时刻

    腾讯混元与清华推出Bee项目,首创“以数据为中心”的全栈开源方案,通过Honey-Data-15M高质量数据集、HoneyPipe数据增强管线及Bee-8B模型,显著提升全开源多模态大模型性能,缩小与闭源模型差距。
  • 11.14 09:27:01
    发表了文章 2025-11-14 09:27:01

    美团 LongCat 团队发布全模态一站式评测基准UNO-Bench:揭示单模态与全模态能力的组合规律

    美团LongCat团队推出一站式全模态大模型评测基准UNO-Bench,首创“组合定律”揭示多模态能力协同增益,支持中文场景,以98%跨模态问题占比和创新多步开放式题型,科学评估模型真实融合能力。
  • 11.13 13:40:50
    发表了文章 2025-11-13 13:40:50

    Agent Skills技术协议与开源实现,让大模型拥有“即插即用”技能

    Anthropic推出Agent Skills协议,通过模块化技能封装提升大模型智能体的专业能力。ModelScope开源项目MS-Agent已实现该协议,支持技能的动态加载、自主执行与安全沙箱运行,推动智能体能力的可组合与可扩展发展。
  • 11.12 09:30:23
    发表了文章 2025-11-12 09:30:23

    仅3B激活参数,更强的多模态理解与推理能力,百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源!

    11月11日,百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型,仅3B激活参数,性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能,支持工具调用与视频分析,适用于复杂图文任务,全面开放商用。
  • 11.11 10:25:52
    发表了文章 2025-11-11 10:25:52

    阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

    阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX,支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制,采用统一LLM框架,实现文本驱动音频创作。
  • 11.10 14:24:12
    发表了文章 2025-11-10 14:24:12

    Mcore Bridge:迈向Megatron训练"零门槛"时代

    魔搭社区推出Mcore-Bridge与Megatron-SWIFT,显著降低大模型训练门槛。支持safetensors格式、一键启动、无需权重转换,兼容MoE等架构,实现高性能与易用性统一,让Megatron训练开箱即用。
  • 11.10 14:11:02
    发表了文章 2025-11-10 14:11:02

    ChatPPT+魔搭社区:MCP 2.0全面升级!

    ChatPPT MCP2.0正式发布,联合魔搭ModelScope推出云端智能体服务,支持生成、编辑、演讲、动画等全链路功能,开放Streamable HTTP协议与本地Stdio双模式,已接入20+平台,服务300+开发者。
  • 11.04 10:38:27
    发表了文章 2025-11-04 10:38:27

    超长序列并行之Ulysses + Ring-Attention技术原理与实现

    本文介绍大模型长序列训练中的显存优化技术,重点解析Ulysses与Ring-Attention的融合方案。通过序列并行降低显存占用,结合zigzag切分与padding_free适配,实现高效多模态训练,在3B模型上显存从75GB降至18GB,显著提升长序列训练可行性。
  • 11.03 16:53:28
    发表了文章 2025-11-03 16:53:28

    Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast,已登顶Hugging Face TTS趋势榜!

    Soul AI Lab联合西工大、上交大开源SoulX-Podcast,支持中英粤川等多语种方言及副语言生成,可稳定输出超60分钟自然流畅的多人对话音频,已在Huggingface登顶TTS趋势榜。

2025年10月

  • 10.31 11:21:21
    发表了文章 2025-10-31 11:21:21

    Thinking Machines Lab最新研究结果如何复现?On-Policy Distillation让训练成本直降10倍

    Thinking Machines Lab提出On-Policy Distillation技术,让小模型高效继承大模型能力。相比传统强化学习,训练成本降低90%,效率提升十倍,支持本地部署、降低成本与延迟。结合vLLM加速与独立DeepSpeed配置,MS-SWIFT框架实现开箱即用的高效蒸馏训练,助力轻量模型具备“会思考、能纠错、可进化”的智能。
  • 10.30 18:03:06
    发表了文章 2025-10-30 18:03:06

    UI-Ins:让 GUI 智能体真正“看懂”用户指令的新范式

    通义实验室联合人大发布全新GUI Grounding模型UI-Ins,首创“指令即推理”范式,通过多视角动态推理实现SOTA性能,在五大基准全面领先,支持开源复现与应用。
  • 10.29 09:59:22
    发表了文章 2025-10-29 09:59:22

    全新框架 Glyph 开源:用视觉理解文本,3–4 倍上下文压缩,近 5 倍推理提速!

    清华CoAI与智谱AI提出Glyph新范式,将长文本渲染为图像,通过视觉语言模型实现高效长上下文处理。3-4倍压缩比,性能媲美主流大模型,显存占用降2/3,低成本支持百万token任务,开源可商用。
  • 10.27 10:44:06
    发表了文章 2025-10-27 10:44:06

    仅100多元,他给视障人群装上AI“眼睛”

    上海两名开发者为验证AI助盲实效,亲手打造百元AI眼镜,蒙眼实测过马路、识盲道,并开源项目鼓励更多人参与。技术导航,人心照亮。
  • 10.27 10:26:57
    发表了文章 2025-10-27 10:26:57

    「超级开发个体」在诞生:一份白皮书带你理解AI时代开发者

    10月24日程序员节,魔搭社区联合知乎发布《THE NEXT WAVE:AI时代开发者生态白皮书》,揭示AI时代开发者新画像:以“超级个体”为核心,兼具技术与商业闭环能力,工具平权让个人开发者崛起。报告涵盖年龄、学历、组织分布及认知行为特征,展现开发者如何用AI提效、实现从“写代码”到“搭系统”的跃迁。点击下载完整报告。
  • 10.27 10:24:49
    发表了文章 2025-10-27 10:24:49

    腾讯混元世界模型1.1开源:支持多视图及视频输入,单卡部署,秒级生成_魔搭ModelScope社区-ModelScope魔搭社区

    混元世界模型1.1(WorldMirror)发布,支持多视图、视频输入,单卡秒级生成3D场景。兼容CG管线,开源可部署,实现点云、深度、相机等多任务统一预测,性能领先。
  • 10.23 11:44:30
    发表了文章 2025-10-23 11:44:30

    Qwen3-VL新成员 2B、32B来啦!更适合开发者体质

    Qwen3-VL家族重磅推出2B与32B双版本,轻量高效与超强推理兼备,一模型通吃多模态与纯文本任务!
  • 10.17 18:36:52
    发表了文章 2025-10-17 18:36:52

    Face-to-Photo 模型开源!联名麦橘MERJIC,遇见另一个你!

    魔搭 DiffSynth-Studio 团队携手知名创作者麦橘MERJIC,正式开源全新 AI 图像生成模型——Face-to-Photo!该模型基于 Qwen-Image-Edit,采用 LoRA 的模型结构,专为人脸图像生成而优化,将一张普通的人脸照片转化…
  • 10.17 10:39:15
    发表了文章 2025-10-17 10:39:15

    ModelScope魔搭社区发布月报 -- 25年10月

    2025年10月,ModelScope密集发布多模态与大模型更新,并上线国际站、科学智能专区及AIGC工具FlowBench,加速开源生态发展。
  • 10.14 09:43:57
    发表了文章 2025-10-14 09:43:57

    用Macbook微调Qwen3!手把手教你用微调给Qwen起一个新名字

    本文介绍如何在MacBook上使用苹果MLX框架高效微调Qwen3大模型。借助MLX的高性能计算与统一内存架构,仅需2分钟即可完成训练,内存占用低至2GB,推理速度达400 Token/s,并支持快速部署为本地API服务,展现Mac轻薄本的强大AI生产力潜力。
  • 10.13 10:59:12
    发表了文章 2025-10-13 10:59:12

    图像理解与生成统一模型——前沿模型架构理解

    前言生成式多模态模型近年来一直是业界的研究热点。视觉语言模型(VLM)一直是多模态文本生成领域的核心路线,能够完成图像理解任务;扩散模型(Diffusion Model)则一直是图像和视频生成领域的核心方法。
  • 10.10 09:55:33
    发表了文章 2025-10-10 09:55:33

    Ling-1T,智渊、思简

    今天,我们正式发布Ling 2.0系列的第一款 旗舰非思考模型 - 拥有万亿参数的Ling-1T。推理,是智能的核心表达,更是通用智能体的认知基石。因此,我们持续扩展Ling 2.0 系列模型的自然语言推理能力。Ling-1T沿用 Li…
  • 10.09 10:30:37
    发表了文章 2025-10-09 10:30:37

    智谱旗舰模型GLM-4.6开源发布,代码能力对齐Claude Sonnet 4

    作为GLM系列的最新版本,GLM-4.6是系列最强的代码Coding模型(较GLM-4.5提升27%)

2025年09月

  • 发表了文章 2025-11-24

    AgentEvolver:让智能体系统学会「自我进化」

  • 发表了文章 2025-11-24

    Meta SAM3开源:让图像分割,听懂你的话

  • 发表了文章 2025-11-21

    Meta SAM3开源:让图像分割,听懂你的话

  • 发表了文章 2025-11-20

    MemOS 正式上线魔搭社区 MCP 广场,让你的智能体拥有「长期记忆」

  • 发表了文章 2025-11-19

    ModelScope魔搭社区发布月报 -- 25年11月

  • 发表了文章 2025-11-18

    码上生花:用API链接Qwen-Image系列及衍生LoRA生态模型

  • 发表了文章 2025-11-17

    腾讯混元&清华开源15M高质量多模态训练数据,全面开放MLLM迎来质变时刻

  • 发表了文章 2025-11-14

    美团 LongCat 团队发布全模态一站式评测基准UNO-Bench:揭示单模态与全模态能力的组合规律

  • 发表了文章 2025-11-12

    仅3B激活参数,更强的多模态理解与推理能力,百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源!

  • 发表了文章 2025-11-11

    阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

  • 发表了文章 2025-11-10

    Mcore Bridge:迈向Megatron训练"零门槛"时代

  • 发表了文章 2025-11-10

    ChatPPT+魔搭社区:MCP 2.0全面升级!

  • 发表了文章 2025-11-04

    超长序列并行之Ulysses + Ring-Attention技术原理与实现

  • 发表了文章 2025-11-03

    Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast,已登顶Hugging Face TTS趋势榜!

  • 发表了文章 2025-10-31

    Thinking Machines Lab最新研究结果如何复现?On-Policy Distillation让训练成本直降10倍

  • 发表了文章 2025-10-30

    UI-Ins:让 GUI 智能体真正“看懂”用户指令的新范式

  • 发表了文章 2025-10-29

    全新框架 Glyph 开源:用视觉理解文本,3–4 倍上下文压缩,近 5 倍推理提速!

  • 发表了文章 2025-10-27

    仅100多元,他给视障人群装上AI“眼睛”

  • 发表了文章 2025-10-27

    腾讯混元世界模型1.1开源:支持多视图及视频输入,单卡部署,秒级生成_魔搭ModelScope社区-ModelScope魔搭社区

  • 发表了文章 2025-10-27

    「超级开发个体」在诞生:一份白皮书带你理解AI时代开发者

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
滑动查看更多