备案控制台

模型库

数据集

创空间

文档

文章

视频

问答

推荐

t-25774453200-61

|

问答

置顶

我希望通过damo-YOLO训练1500*1500的图片

14923 7 51

来自：计算机视觉版块

已解决

modelscope

|

20小时前

|

机器学习/深度学习人工智能自然语言处理

|

博文

AgentEvolver：让智能体系统学会「自我进化」

AgentEvolver 是一个自进化智能体系统，通过自我任务生成、经验导航与反思归因三大机制，推动AI从“被动执行”迈向“主动学习”。它显著提升强化学习效率，在更少参数下实现更强性能，助力智能体持续自我迭代。开源地址：https://github.com/modelscope/AgentEvolver

44 0 0

modelscope

|

21小时前

|

数据采集人工智能自然语言处理

|

博文

Meta SAM3开源：让图像分割，听懂你的话

Meta发布并开源SAM 3，首个支持文本或视觉提示的统一图像视频分割模型，可精准分割“红色条纹伞”等开放词汇概念，覆盖400万独特概念，性能达人类水平75%–80%，推动视觉分割新突破。

47 0 0

游客ak35f7cs4gw4c

|

2天前

|

Apache 自然语言处理

|

问答

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

60 0 0

来自：多模态版块

蚂蚁百宝箱

|

3天前

|

人工智能搜索推荐小程序

|

博文

全来店×蚂蚁百宝箱：智能体开启连锁餐饮智慧化服务新时代

2025外滩大会，全来店联合蚂蚁百宝箱发布餐饮AI智能体，打造“AI点餐吧”。依托百灵大模型，实现一句话点餐、个性化推荐、精准营销与连锁管控，重构智慧餐饮服务链，推动行业降本增效，开启消费新体验。

68 2 2

来自：自然语言处理版块

modelscope

|

3天前

|

数据采集人工智能自然语言处理

|

博文

Meta SAM3开源：让图像分割，听懂你的话

Meta发布并开源SAM 3，首个支持文本、点、框等提示进行图像与视频分割的统一基础模型，突破传统限制，实现开放词汇概念的精准识别与跟踪，涵盖超400万独特概念，推动视觉分割新发展。

180 6 6

maoyutinga1

|

4天前

|

存储数据采集人工智能

|

博文

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

随着人工智能技术的不断发展，虚拟角色不再只是冰冷的对话机器，而是能够承载历史人物的气质、知识体系乃至精神风貌的“数字化身”。今天，我们将完整揭秘如何基于Qwen3-8B大模型，借助LLaMA-Factory Online平台，打造一个沉浸式的“苏东坡数字分身”，让前沿技术为文化传承注入新的活力。

127 9 10

来自：自然语言处理版块

游客vvdippgvds2sg

|

4天前

|

问答

mcp部署连接mcp服务失败，原因是什么，如何查看原因？

46 1 0

kxmbw7hmu3wwe

|

4天前

|

API

|

问答

可以使用什么工具识别图片中类似的东倒西歪的文字吗？最好可以开放api调用的工具

54 0 0

modelscope

|

4天前

|

人工智能调度开发工具

|

博文

MemOS 正式上线魔搭社区 MCP 广场，让你的智能体拥有「长期记忆」

MemOS 正式上线魔搭社区 MCP 广场，作为首个大模型记忆操作系统，支持标准化记忆读写，7天调用量超14.9万次。开发者可一键集成，让AI具备持久化、可调度的记忆能力，实现连续思考与长期进化。

89 3 3

Maxwiz

|

4天前

|

问答

申请在魔搭MCP广场对/chictr-mcp-server进行hosted托管

32 0 0

modelscope

|

5天前

|

人工智能文字识别物联网

|

博文

ModelScope魔搭社区发布月报 -- 25年11月

魔搭ModelScope三周年庆！见证开源大模型从追赶到领跑，11月硬核更新不断：Qwen3-VL、MiniMax-M2等新模态齐发，AIGC生态爆发，OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会，不见不散！

180 4 4

游客p4z4s6fxyf22y

|

6天前

|

问答

请问怎么清理内存，老师说这些文件不占内存，求大神解答

60 0 0

modelscope

|

6天前

|

编解码物联网 API

|

博文

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

Qwen-Image系列开源三月成爆款，凭借中文场景优势与ModelScope平台深度集成，支持文生图、图像编辑及LoRA生态API调用，助力开发者高效创作。

239 1 1

愤怒的炮爷

|

7天前

|

测试技术异构计算

|

问答

菜鸡提问，弱弱的问问免费的PAI-DSW GPU开发环境是支持有公网地址还是外围地址转换的吗？

43 0 0

无峰asr-12985

|

7天前

|

问答

使用modelscope下载模型后，如何简单的进行模型权重文件完整性校验？

49 0 0

modelscope

|

7天前

|

数据采集文字识别算法

|

博文

腾讯混元&清华开源15M高质量多模态训练数据，全面开放MLLM迎来质变时刻

腾讯混元与清华推出Bee项目，首创“以数据为中心”的全栈开源方案，通过Honey-Data-15M高质量数据集、HoneyPipe数据增强管线及Bee-8B模型，显著提升全开源多模态大模型性能，缩小与闭源模型差距。

181 4 4

robet

|

9天前

|

问答

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

84 0 0

来自：自然语言处理版块

探索云世界

|

10天前

|

搜索推荐 API Python

|

博文

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

今日发布DeepSeek-V3.1，支持混合推理架构，提升思考效率与Agent能力。编程与搜索智能体表现显著增强，API已升级并支持Anthropic格式，模型开源，上下文扩展至128K。

399 5 5

探索云世界

|

10天前

|

人工智能物联网测试技术

|

博文

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

通义千问团队开源Qwen-Image-Edit，基于20B模型，支持语义与外观双重编辑、精准中英文文字修改，具备SOTA图像编辑能力，可用于IP创作、风格迁移、文字修复等。

329 6 6

游客pj7nlkcvhvppi

|

10天前

|

编解码人工智能文字识别

|

博文

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

DeepSeek-OCR开源即获7k+星，首创“上下文光学压缩”技术，仅用100视觉token超越传统OCR模型256token性能，压缩比达10-20倍，精度仍超97%。30亿参数实现单卡日处理20万页，显著降低大模型长文本输入成本，重新定义高效文档理解新范式。

165 2 2

来自：计算机视觉版块

modelscope

|

10天前

|

数据采集人工智能算法

|

博文

美团 LongCat 团队发布全模态一站式评测基准UNO-Bench：揭示单模态与全模态能力的组合规律

美团LongCat团队推出一站式全模态大模型评测基准UNO-Bench，首创“组合定律”揭示多模态能力协同增益，支持中文场景，以98%跨模态问题占比和创新多步开放式题型，科学评估模型真实融合能力。

319 5 5

蚂蚁百宝箱

|

11天前

|

人工智能自然语言处理资源调度

|

博文

蚂蚁百宝箱“一箱搞定”会展智能，「桐小乌」为乌镇互联网大会提供全天候一站式向导服务

2025世界互联网大会·乌镇峰会圆满落幕，蚂蚁百宝箱依托智能体开发平台，快速打造会展专属智能体“桐小乌”，实现会前、会中、会后全链路智能化服务。通过“碰一下”打卡、AR导览、智能问答等功能，提升参会体验；基于行业模板与零代码能力，助力展会高效运营，推动智能会展“一箱搞定”。

89 9 9

来自：自然语言处理版块

游客lztrts5drmmq4

|

11天前

|

异构计算并行计算 Python

|

问答

本地部署Qwen3-4B 模型，无法调用GPU

93 0 0

来自：自然语言处理版块

dt_2691532407-30455

|

12天前

|

博文

刚刚参加了一个MCP赛事，奖金还可以，搭友们可以去试试看

社区8月比赛未获奖有点失落，但发现通义灵码×蚂蚁百宝箱MCP赛事正火热进行！参赛即有机会赢取丰厚奖金，激励满满，令人眼前一亮。已跃跃欲试，搭友们快来一起冲榜夺奖吧！https://tianchi.aliyun.com/competition/entrance/532442

148 2 2

ZhangCraig

|

12天前

|

人工智能前端开发关系型数据库

|

博文

MajorRAG 概述（1/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法

89 1 1

来自：自然语言处理版块

ykanyezdnax7a

|

12天前

|

问答

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

49 0 0

来自：计算机视觉版块

ZhangCraig

|

12天前

|

存储 JSON 人工智能

|

博文

MajorRAG聊天问答系统实现分析（3/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

175 1 1

ZhangCraig

|

12天前

|

存储关系型数据库 MySQL

|

博文

MajorRAG文件内容提取实现分析（2/3）

一个RAG项目，全文共三个部分：MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1）第一次做RAG，欢迎带着指导意见评论 2）希望指出不足时可以附带替换方法博客地址：https://zhangcraigxg.github.io

87 1 1

游客77ikadlqxugne

|

12天前

|

人工智能 JavaScript API

|

博文

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

本文对比了OpenAI、Google、Claude及开源平台如agtm 的AI Agent注册与发布方法，重点介绍AI Agent Registry API、社区和Marketplace三种方式，帮助开发者和产品经理提升智能体的可见性与分发渠道。

134 0 0

modelscope

|

12天前

|

机器学习/深度学习数据可视化 Apache

|

博文

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

11月11日，百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型，仅3B激活参数，性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能，支持工具调用与视频分析，适用于复杂图文任务，全面开放商用。

215 17 17

robotliu0327_nwhel

|

13天前

|

索引 API

|

问答

embedding模型部署调用出现接口调用不一致

85 0 0

来自：自然语言处理版块

modelscope

|

13天前

|

自然语言处理语音技术 Apache

|

博文

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX，支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制，采用统一LLM框架，实现文本驱动音频创作。

389 88 88

blanklog

|

13天前

|

数据处理

|

问答

魔塔社区AIGC 模型训练可以上传本地的打标文件么？

59 0 0

来自：计算机视觉版块

modelscope

|

14天前

|

机器学习/深度学习算法物联网

|

博文

Mcore Bridge：迈向Megatron训练"零门槛"时代

魔搭社区推出Mcore-Bridge与Megatron-SWIFT，显著降低大模型训练门槛。支持safetensors格式、一键启动、无需权重转换，兼容MoE等架构，实现高性能与易用性统一，让Megatron训练开箱即用。

269 10 10

modelscope

|

14天前

|

JavaScript 搜索推荐开发者

|

博文

ChatPPT+魔搭社区：MCP 2.0全面升级！

ChatPPT MCP2.0正式发布，联合魔搭ModelScope推出云端智能体服务，支持生成、编辑、演讲、动画等全链路功能，开放Streamable HTTP协议与本地Stdio双模式，已接入20+平台，服务300+开发者。

355 11 11

小6子哥

|

17天前

|

人工智能 Cloud Native 前端开发

|

博文

详细教程 PhpStorm 2025.1 安装+ 激活中文配置，附安装包

PhpStorm 2025.1 全新升级，深度支持 PHP 8.3+/8.4，强化 AI 助手、Xdebug 调试与 .env 嵌套变量，提升全栈开发效率，打造现代化 PHP 开发利器。

215 0 0

蚂蚁百宝箱

|

18天前

|

人工智能搜索推荐 API

|

博文

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

蚂蚁百宝箱联合深铁集团、深圳通推出全国首个“公共出行+城市服务”AI智能体「深铁宝」，上线于深圳地铁、深圳通及支付宝APP，实现一句话直达、秒级响应的智慧出行体验，涵盖出行规划、乘车码快捷调取、周边生活服务推荐等一站式功能，助力城市交通与服务数字化升级。

197 30 31

来自：自然语言处理版块

啦啦啦191

|

18天前

|

安全 Java 数据库连接

|

博文

如何在Java代码中处理数据库连接异常

在Java中，合理处理数据库连接异常对程序稳定性至关重要。需捕获`ClassNotFoundException`和`SQLException`等具体异常，使用`try-with-resources`自动释放资源，结合日志记录与用户友好提示，并可引入重试机制应对网络波动，提升系统容错能力。

147 1 2

MaxIt

|

19天前

|

问答

在线模型图片生成次数限制

78 1 0

游客4olayymf2ta3i

|

19天前

|

API

|

问答

minimax接入vscode，为什么今天会不间断的出现错误

78 0 0

来自：多模态版块

modelscope

|

20天前

|

并行计算负载均衡关系型数据库

|

博文

超长序列并行之Ulysses + Ring-Attention技术原理与实现

本文介绍大模型长序列训练中的显存优化技术，重点解析Ulysses与Ring-Attention的融合方案。通过序列并行降低显存占用，结合zigzag切分与padding_free适配，实现高效多模态训练，在3B模型上显存从75GB降至18GB，显著提升长序列训练可行性。

546 39 39

小6子哥

|

20天前

|

IDE 编译器开发工具

|

博文

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

Keil C51 V9.61是一款专用于8051系列单片机的集成开发环境，支持主流厂商芯片，集编辑、编译、仿真于一体，基于μVision5平台，操作便捷。提供C编译器、汇编器、调试器等全套工具，适用于嵌入式开发。附带安装与激活教程，可实现汉化界面，提升使用体验。（237字）

590 7 7

1504110813821446

|

21天前

|

JavaScript Shell

|

问答

funasr使用8k模型识别电话录音返回乱码

55 0 0

心中天堂lxr

|

21天前

|

云栖大会

|

问答

flowbench-flowra 开源？

49 0 0

游客zbyde6evs4owe

|

21天前

|

API

|

问答

cursor使用魔塔API没有响应

94 0 0

modelscope

|

21天前

|

人工智能自然语言处理语音技术

|

博文

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

Soul AI Lab联合西工大、上交大开源SoulX-Podcast，支持中英粤川等多语种方言及副语言生成，可稳定输出超60分钟自然流畅的多人对话音频，已在Huggingface登顶TTS趋势榜。

314 0 0

游客f4wpj4mefuj3c

|

21天前

|

问答

宜搭如何实现日期区间组件请假时段开始时间为当日8点结束时间为当日16.45得出的数值组件为8小时

105 1 0

1504110813821446

|

23天前

|

Shell

|

问答

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

111 1 0

来自：自然语言处理版块

游客obapqouyazly6

|

24天前

|

数据挖掘数据库供应链

|

问答

数据分析模型

74 0 0

来自：自然语言处理版块

1

2

3

4

...

50

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

0

今日

14443

内容

6

活动

3747

关注

你好！

登录掌握更多精彩内容

账号登录

我的内容

我的收藏

模型库

数据集

创空间

文档

活跃用户

最新

文章

视频

问答

推荐

我希望通过damo-YOLO训练1500*1500的图片

AgentEvolver：让智能体系统学会「自我进化」

Meta SAM3开源：让图像分割，听懂你的话

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

全来店×蚂蚁百宝箱：智能体开启连锁餐饮智慧化服务新时代

Meta SAM3开源：让图像分割，听懂你的话

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

mcp部署连接mcp服务失败，原因是什么，如何查看原因？

可以使用什么工具识别图片中类似的东倒西歪的文字吗？最好可以开放api调用的工具

MemOS 正式上线魔搭社区 MCP 广场，让你的智能体拥有「长期记忆」

申请在魔搭MCP广场对/chictr-mcp-server进行hosted托管

ModelScope魔搭社区发布月报 -- 25年11月

请问怎么清理内存，老师说这些文件不占内存，求大神解答

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

菜鸡提问，弱弱的问问免费的PAI-DSW GPU开发环境 是支持有公网地址还是外围地址转换的吗？

使用modelscope下载模型后，如何简单的进行模型权重文件完整性校验？

腾讯混元&清华开源15M高质量多模态训练数据，全面开放MLLM迎来质变时刻

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

美团 LongCat 团队发布全模态一站式评测基准UNO-Bench：揭示单模态与全模态能力的组合规律

蚂蚁百宝箱“一箱搞定”会展智能，「桐小乌」为乌镇互联网大会提供全天候一站式向导服务

本地部署Qwen3-4B 模型，无法调用GPU

刚刚参加了一个MCP赛事，奖金还可以，搭友们可以去试试看

MajorRAG 概述（1/3）

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

MajorRAG聊天问答系统实现分析（3/3）

MajorRAG文件内容提取实现分析（2/3）

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

仅3B激活参数，更强的多模态理解与推理能力，百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源！

embedding模型部署调用出现接口调用不一致

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

魔塔社区AIGC 模型训练可以上传本地的打标文件么？

Mcore Bridge：迈向Megatron训练"零门槛"时代

ChatPPT+魔搭社区：MCP 2.0全面升级！

详细教程 PhpStorm 2025.1 安装+ 激活中文配置，附安装包

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

如何在Java代码中处理数据库连接异常

在线模型图片生成次数限制

minimax接入vscode，为什么今天会不间断的出现错误

超长序列并行之Ulysses + Ring-Attention技术原理与实现

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

funasr使用8k模型识别电话录音返回乱码

flowbench-flowra 开源？

cursor使用魔塔API没有响应

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

宜搭如何实现日期区间组件请假时段开始时间为当日8点结束时间为当日16.45得出的数值组件为8小时

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

数据分析模型

ModelScope模型即服务

活跃用户

相关产品

菜鸡提问，弱弱的问问免费的PAI-DSW GPU开发环境是支持有公网地址还是外围地址转换的吗？