文档备案控制台

模型库

数据集

创空间

文档

文章

视频

问答

推荐

modelscope

|

7月前

|

数据采集人工智能自然语言处理

|

博文

Meta SAM3开源：让图像分割，听懂你的话

Meta发布并开源SAM 3，首个支持文本、点、框等提示进行图像与视频分割的统一基础模型，突破传统限制，实现开放词汇概念的精准识别与跟踪，涵盖超400万独特概念，推动视觉分割新发展。

2979 6 6

maoyutinga1

|

7月前

|

存储数据采集人工智能

|

博文

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

随着人工智能技术的不断发展，虚拟角色不再只是冰冷的对话机器，而是能够承载历史人物的气质、知识体系乃至精神风貌的“数字化身”。今天，我们将完整揭秘如何基于Qwen3-8B大模型，借助LLaMA-Factory Online平台，打造一个沉浸式的“苏东坡数字分身”，让前沿技术为文化传承注入新的活力。

1238 10 13

来自：自然语言处理版块

游客vvdippgvds2sg

|

7月前

|

问答

mcp部署连接mcp服务失败，原因是什么，如何查看原因？

176 1 0

kxmbw7hmu3wwe

|

7月前

|

API

|

问答

可以使用什么工具识别图片中类似的东倒西歪的文字吗？最好可以开放api调用的工具

182 1 0

modelscope

|

7月前

|

人工智能调度开发工具

|

博文

MemOS 正式上线魔搭社区 MCP 广场，让你的智能体拥有「长期记忆」

MemOS 正式上线魔搭社区 MCP 广场，作为首个大模型记忆操作系统，支持标准化记忆读写，7天调用量超14.9万次。开发者可一键集成，让AI具备持久化、可调度的记忆能力，实现连续思考与长期进化。

1439 3 5

Maxwiz

|

7月前

|

问答

申请在魔搭MCP广场对/chictr-mcp-server进行hosted托管

137 0 0

modelscope

|

7月前

|

人工智能文字识别物联网

|

博文

ModelScope魔搭社区发布月报 -- 25年11月

魔搭ModelScope三周年庆！见证开源大模型从追赶到领跑，11月硬核更新不断：Qwen3-VL、MiniMax-M2等新模态齐发，AIGC生态爆发，OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会，不见不散！

850 5 5

游客p4z4s6fxyf22y

|

7月前

|

问答

请问怎么清理内存，老师说这些文件不占内存，求大神解答

167 0 0

modelscope

|

7月前

|

编解码物联网 API

|

博文

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

Qwen-Image系列开源三月成爆款，凭借中文场景优势与ModelScope平台深度集成，支持文生图、图像编辑及LoRA生态API调用，助力开发者高效创作。

2205 1 1

愤怒的炮爷

|

7月前

|

测试技术异构计算

|

问答

菜鸡提问，弱弱的问问免费的PAI-DSW GPU开发环境是支持有公网地址还是外围地址转换的吗？

146 0 0

无峰asr-12985

|

7月前

|

问答

使用modelscope下载模型后，如何简单的进行模型权重文件完整性校验？

356 0 0

modelscope

|

7月前

|

数据采集文字识别算法

|

博文

腾讯混元&清华开源15M高质量多模态训练数据，全面开放MLLM迎来质变时刻

腾讯混元与清华推出Bee项目，首创“以数据为中心”的全栈开源方案，通过Honey-Data-15M高质量数据集、HoneyPipe数据增强管线及Bee-8B模型，显著提升全开源多模态大模型性能，缩小与闭源模型差距。

732 4 4

robet

|

7月前

|

问答

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

299 0 0

来自：自然语言处理版块

探索云世界

|

7月前

|

搜索推荐 API Python

|

博文

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

今日发布DeepSeek-V3.1，支持混合推理架构，提升思考效率与Agent能力。编程与搜索智能体表现显著增强，API已升级并支持Anthropic格式，模型开源，上下文扩展至128K。

1069 5 5

探索云世界

|

7月前

|

人工智能物联网测试技术

|

博文

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

通义千问团队开源Qwen-Image-Edit，基于20B模型，支持语义与外观双重编辑、精准中英文文字修改，具备SOTA图像编辑能力，可用于IP创作、风格迁移、文字修复等。

6406 6 6

nick6507384252

|

7月前

|

编解码人工智能文字识别

|

博文

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

DeepSeek-OCR开源即获7k+星，首创“上下文光学压缩”技术，仅用100视觉token超越传统OCR模型256token性能，压缩比达10-20倍，精度仍超97%。30亿参数实现单卡日处理20万页，显著降低大模型长文本输入成本，重新定义高效文档理解新范式。

649 2 2

来自：计算机视觉版块

modelscope

|

7月前

|

数据采集人工智能算法

|

博文

美团 LongCat 团队发布全模态一站式评测基准UNO-Bench：揭示单模态与全模态能力的组合规律

美团LongCat团队推出一站式全模态大模型评测基准UNO-Bench，首创“组合定律”揭示多模态能力协同增益，支持中文场景，以98%跨模态问题占比和创新多步开放式题型，科学评估模型真实融合能力。

795 5 5

游客lztrts5drmmq4

|

7月前

|

异构计算并行计算 Python

|

问答

本地部署Qwen3-4B 模型，无法调用GPU

369 0 0

来自：自然语言处理版块

dt_2691532407-30455

|

7月前

|

博文

刚刚参加了一个MCP赛事，奖金还可以，搭友们可以去试试看

社区8月比赛未获奖有点失落，但发现通义灵码×蚂蚁百宝箱MCP赛事正火热进行！参赛即有机会赢取丰厚奖金，激励满满，令人眼前一亮。已跃跃欲试，搭友们快来一起冲榜夺奖吧！https://tianchi.aliyun.com/competition/entrance/532442

317 2 2

ZhangCraig

|

7月前

|

人工智能前端开发关系型数据库

|

博文

MajorRAG 概述（1/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法

356 1 1

来自：自然语言处理版块

ykanyezdnax7a

|

7月前

|

问答

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

184 0 0

来自：计算机视觉版块

ZhangCraig

|

7月前

|

存储 JSON 人工智能

|

博文

MajorRAG聊天问答系统实现分析（3/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

416 1 1

ZhangCraig

|

7月前

|

存储关系型数据库 MySQL

|

博文

MajorRAG文件内容提取实现分析（2/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

348 1 2

游客77ikadlqxugne

|

7月前

|

人工智能 JavaScript API

|

博文

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

本文对比了OpenAI、Google、Claude及开源平台如agtm 的AI Agent注册与发布方法，重点介绍AI Agent Registry API、社区和Marketplace三种方式，帮助开发者和产品经理提升智能体的可见性与分发渠道。

1372 0 0

modelscope

|

7月前

|

机器学习/深度学习数据可视化 Apache

|

博文

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

11月11日，百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型，仅3B激活参数，性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能，支持工具调用与视频分析，适用于复杂图文任务，全面开放商用。

961 17 17

robotliu0327_nwhel

|

7月前

|

索引 API

|

问答

embedding模型部署调用出现接口调用不一致

262 0 0

来自：自然语言处理版块

modelscope

|

7月前

|

自然语言处理语音技术 Apache

|

博文

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX，支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制，采用统一LLM框架，实现文本驱动音频创作。

1039 88 88

blanklog

|

7月前

|

数据处理

|

问答

魔塔社区AIGC 模型训练可以上传本地的打标文件么？

262 0 0

来自：计算机视觉版块

modelscope

|

7月前

|

机器学习/深度学习算法物联网

|

博文

Mcore Bridge：迈向Megatron训练"零门槛"时代

魔搭社区推出Mcore-Bridge与Megatron-SWIFT，显著降低大模型训练门槛。支持safetensors格式、一键启动、无需权重转换，兼容MoE等架构，实现高性能与易用性统一，让Megatron训练开箱即用。

1220 10 10

modelscope

|

7月前

|

JavaScript 搜索推荐开发者

|

博文

ChatPPT+魔搭社区：MCP 2.0全面升级！

ChatPPT MCP2.0正式发布，联合魔搭ModelScope推出云端智能体服务，支持生成、编辑、演讲、动画等全链路功能，开放Streamable HTTP协议与本地Stdio双模式，已接入20+平台，服务300+开发者。

1051 11 11

小6子哥

|

7月前

|

人工智能 Cloud Native 前端开发

|

博文

详细教程 PhpStorm 2025.1 安装+ 激活中文配置，附安装包

PhpStorm 2025.1 全新升级，深度支持 PHP 8.3+/8.4，强化 AI 助手、Xdebug 调试与 .env 嵌套变量，提升全栈开发效率，打造现代化 PHP 开发利器。

1347 0 0

啦啦啦191

|

7月前

|

安全 Java 数据库连接

|

博文

如何在Java代码中处理数据库连接异常

在Java中，合理处理数据库连接异常对程序稳定性至关重要。需捕获`ClassNotFoundException`和`SQLException`等具体异常，使用`try-with-resources`自动释放资源，结合日志记录与用户友好提示，并可引入重试机制应对网络波动，提升系统容错能力。

427 1 2

MaxIt

|

7月前

|

问答

在线模型图片生成次数限制

230 1 0

游客4olayymf2ta3i

|

7月前

|

API

|

问答

minimax接入vscode，为什么今天会不间断的出现错误

265 0 0

来自：多模态版块

小6子哥

|

7月前

|

IDE 编译器开发工具

|

博文

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

Keil C51 V9.61是一款专用于8051系列单片机的集成开发环境，支持主流厂商芯片，集编辑、编译、仿真于一体，基于μVision5平台，操作便捷。提供C编译器、汇编器、调试器等全套工具，适用于嵌入式开发。附带安装与激活教程，可实现汉化界面，提升使用体验。（237字）

11247 9 9

1504110813821446

|

7月前

|

JavaScript Shell

|

问答

funasr使用8k模型识别电话录音返回乱码

184 0 0

心中天堂lxr

|

7月前

|

云栖大会

|

问答

flowbench-flowra 开源？

169 0 0

游客zbyde6evs4owe

|

7月前

|

API

|

问答

cursor使用魔塔API没有响应

943 0 0

modelscope

|

7月前

|

人工智能自然语言处理语音技术

|

博文

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

Soul AI Lab联合西工大、上交大开源SoulX-Podcast，支持中英粤川等多语种方言及副语言生成，可稳定输出超60分钟自然流畅的多人对话音频，已在Huggingface登顶TTS趋势榜。

923 0 0

游客f4wpj4mefuj3c

|

7月前

|

问答

宜搭如何实现日期区间组件请假时段开始时间为当日8点结束时间为当日16.45得出的数值组件为8小时

297 1 0

1504110813821446

|

7月前

|

Shell

|

问答

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

442 1 0

来自：自然语言处理版块

游客obapqouyazly6

|

8月前

|

数据挖掘数据库供应链

|

问答

数据分析模型

303 0 0

来自：自然语言处理版块

modelscope

|

8月前

|

机器学习/深度学习人工智能搜索推荐

|

博文

Thinking Machines Lab最新研究结果如何复现？On-Policy Distillation让训练成本直降10倍

Thinking Machines Lab提出On-Policy Distillation技术，让小模型高效继承大模型能力。相比传统强化学习，训练成本降低90%，效率提升十倍，支持本地部署、降低成本与延迟。结合vLLM加速与独立DeepSpeed配置，MS-SWIFT框架实现开箱即用的高效蒸馏训练，助力轻量模型具备“会思考、能纠错、可进化”的智能。

1862 10 10

modelscope

|

8月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

UI-Ins：让 GUI 智能体真正“看懂”用户指令的新范式

通义实验室联合人大发布全新GUI Grounding模型UI-Ins，首创“指令即推理”范式，通过多视角动态推理实现SOTA性能，在五大基准全面领先，支持开源复现与应用。

1045 1 1

modelscope

|

8月前

|

机器学习/深度学习人工智能文字识别

|

博文

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

清华CoAI与智谱AI提出Glyph新范式，将长文本渲染为图像，通过视觉语言模型实现高效长上下文处理。3-4倍压缩比，性能媲美主流大模型，显存占用降2/3，低成本支持百万token任务，开源可商用。

1040 26 27

modelscope

|

8月前

|

传感器人工智能 API

|

博文

仅100多元，他给视障人群装上AI“眼睛”

上海两名开发者为验证AI助盲实效，亲手打造百元AI眼镜，蒙眼实测过马路、识盲道，并开源项目鼓励更多人参与。技术导航，人心照亮。

1738 6 8

modelscope

|

8月前

|

编解码调度图形学

|

博文

腾讯混元世界模型1.1开源：支持多视图及视频输入，单卡部署，秒级生成_魔搭ModelScope社区-ModelScope魔搭社区

混元世界模型1.1（WorldMirror）发布，支持多视图、视频输入，单卡秒级生成3D场景。兼容CG管线，开源可部署，实现点云、深度、相机等多任务统一预测，性能领先。

609 1 1

modelscope

|

8月前

|

人工智能程序员开发者

|

博文

「超级开发个体」在诞生：一份白皮书带你理解AI时代开发者

10月24日程序员节，魔搭社区联合知乎发布《THE NEXT WAVE：AI时代开发者生态白皮书》，揭示AI时代开发者新画像：以“超级个体”为核心，兼具技术与商业闭环能力，工具平权让个人开发者崛起。报告涵盖年龄、学历、组织分布及认知行为特征，展现开发者如何用AI提效、实现从“写代码”到“搭系统”的跃迁。点击下载完整报告。

586 0 0

Rigorous_默

|

8月前

|

人工智能

|

问答

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

832 1 0

游客3tw7lavtvady4

|

8月前

|

问答

modelscope上已休眠的模型无法唤醒，要怎么办？

419 1 0

1

...

16

17

18

...

50

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

0

今日

15250

内容

6

活动

4234

关注

你好！

登录掌握更多精彩内容

账号登录

我的内容

我的收藏

模型库

数据集

创空间

文档

活跃用户

游客32wx7tgdzgk5o

最新

文章

视频

问答

推荐

Meta SAM3开源：让图像分割，听懂你的话

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

mcp部署连接mcp服务失败，原因是什么，如何查看原因？

可以使用什么工具识别图片中类似的东倒西歪的文字吗？最好可以开放api调用的工具

MemOS 正式上线魔搭社区 MCP 广场，让你的智能体拥有「长期记忆」

申请在魔搭MCP广场对/chictr-mcp-server进行hosted托管

ModelScope魔搭社区发布月报 -- 25年11月

请问怎么清理内存，老师说这些文件不占内存，求大神解答

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

菜鸡提问，弱弱的问问免费的PAI-DSW GPU开发环境 是支持有公网地址还是外围地址转换的吗？

使用modelscope下载模型后，如何简单的进行模型权重文件完整性校验？

腾讯混元&清华开源15M高质量多模态训练数据，全面开放MLLM迎来质变时刻

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

美团 LongCat 团队发布全模态一站式评测基准UNO-Bench：揭示单模态与全模态能力的组合规律

本地部署Qwen3-4B 模型，无法调用GPU

刚刚参加了一个MCP赛事，奖金还可以，搭友们可以去试试看

MajorRAG 概述（1/3）

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

MajorRAG聊天问答系统实现分析（3/3）

MajorRAG文件内容提取实现分析（2/3）

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

embedding模型部署调用出现接口调用不一致

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

魔塔社区AIGC 模型训练可以上传本地的打标文件么？

Mcore Bridge：迈向Megatron训练"零门槛"时代

ChatPPT+魔搭社区：MCP 2.0全面升级！

详细教程 PhpStorm 2025.1 安装+ 激活中文配置，附安装包

如何在Java代码中处理数据库连接异常

在线模型图片生成次数限制

minimax接入vscode，为什么今天会不间断的出现错误

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

funasr使用8k模型识别电话录音返回乱码

flowbench-flowra 开源？

cursor使用魔塔API没有响应

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

宜搭如何实现日期区间组件请假时段开始时间为当日8点结束时间为当日16.45得出的数值组件为8小时

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

数据分析模型

Thinking Machines Lab最新研究结果如何复现？On-Policy Distillation让训练成本直降10倍

UI-Ins：让 GUI 智能体真正“看懂”用户指令的新范式

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

仅100多元，他给视障人群装上AI“眼睛”

腾讯混元世界模型1.1开源：支持多视图及视频输入，单卡部署，秒级生成_魔搭ModelScope社区-ModelScope魔搭社区

「超级开发个体」在诞生：一份白皮书带你理解AI时代开发者

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

modelscope上已休眠的模型无法唤醒，要怎么办？

ModelScope模型即服务

活跃用户

相关产品

菜鸡提问，弱弱的问问免费的PAI-DSW GPU开发环境是支持有公网地址还是外围地址转换的吗？