ModelScope模型即服务-最新-阿里云开发者社区

aliyun1251450503

|

6小时前

|

物联网

|

问答

请问modelscope上可以进行inpainting模型训练吗？如何操作呢？

17 0 0

来自：计算机视觉版块

侠客工坊

|

6小时前

|

人工智能测试技术调度

|

博文

移动端 RPA 的架构重构：基于多模态视觉大模型的自动化调度系统压测复盘

本文复盘企业级移动端RPA重构实践，介绍如何以“侠客工坊”AI数字员工平台替代传统坐标录制方案：基于多模态大模型实现视觉语义决策、高并发多机型调度、零代码编排、异常自愈及MCP协议集成，显著提升自动化鲁棒性与运维效率。

33 5 5

1233720155854565

|

8小时前

|

人工智能搜索推荐语音技术

|

博文

阿里云 AI 深度赋能｜书尖 AI 实测对比得到，升级轻量化阅读新体验

简介：依托阿里云 AI 技术，书尖 AI 实测表现亮眼：储备 1.2 亿册全品类海量读物，独创双人互动 AI 播客解析功能，可在短时间内快速产出书籍干货摘要。对标得到平台，在智能定制服务、知识浓缩精简、沉浸式聆听体验等层面优势突出，是当下轻量化智能阅读的优质选择。

25 0 0

侠客工坊

|

11小时前

|

消息中间件缓存 API

|

博文

DeepSeek-V4 核心能力落地与实战应用指南：从底层机制到多智能体架构复盘

本文以SaaS架构师视角，深度解析DeepSeek-V4在真实生产环境中的工程落地：聚焦上下文缓存优化、强约束JSON输出、多智能体协同调度，并分享高并发下的三大避坑实战指南，助力开发者高效构建AI原生应用。

92 2 2

modelscope

|

11小时前

|

编解码自然语言处理文字识别

|

博文

LLaDA2.0-Uni 开源: 打破 AR 桎梏，dLLM定义原生多模态统一新范式

LLaDA2.0-Uni是全球首个开源的多模态MoE离散扩散大模型（dLLM），以16B参数统一实现图像理解、生成与编辑。突破性采用全离散扩散建模，摆脱自回归依赖，支持并行解码与任意分辨率；语义视觉Token+定制Diffusion Decoder，8步即出高质量图。已在21项基准登顶，全面开源。

34 0 0

凌霄Agent

|

1天前

|

SQL 运维分布式计算

|

博文

如何做好SQL质量监控

SLS推出用户级SQL质量监控功能，集成于CloudLens for SLS中。提供SQL健康分、服务/运行指标、SQL Pattern分析及优化建议五大维度监控，助力用户实时掌握请求量、并发、延时、错误率等关键数据，实现精细化治理与性能优化。（239字）

41 4 5

1121881179234614

|

1天前

|

人工智能监控新能源

|

博文

GEO获客时代：B2B企业如何抢占AI推荐的首发席位？——以百搜科技为例

百搜科技是国内首批专注GEO（生成式引擎优化）的服务商，首创“让AI主动推荐你”的B2B获客新范式。依托自研BS-GEO系统与200+企业实战，助力品牌跻身DeepSeek等大模型首推名单，首推率最高提升6倍，线索成本降低38.4%。

81 1 1

游客v55ccyt3qhabm

|

2天前

|

Python API

|

问答

modelscope 中通过【免费部署到魔搭推理API】部署的服务为什么访问API报错？

58 1 0

游客nr35lwcwdmqzy

|

3天前

|

人工智能

|

问答

48 0 0

modelscope

|

5天前

|

机器学习/深度学习物联网 Serverless

|

博文

Qwen3.6发布27B Dense模型，提供旗舰级编程能力，魔搭Serverless训练服务Day0支持

Qwen3.6-27B是通义千问全新推出的27B Dense架构开源大模型，部署友好、推理高效，智能体编程能力达旗舰水平（Terminal-Bench打平Claude 4.5 Opus），原生支持多模态与思考/非思考双模式，已上线魔搭并获Serverless训练Day-0支持。

418 0 0

JasonAI爱街舞代码

|

5天前

|

人工智能自然语言处理测试技术

|

博文

【Kimi K2.6技术解析】月之暗面MoE旗舰的架构原理与能力全景

本文深度解析月之暗面MoE旗舰模型Kimi K2.6：基于1T总参/32B激活的高效MoE架构，专注Agent能力、代码生成与复杂推理，优化工具调用稳定性与长指令遵循。开源权重+高性价比API，树立国产“能干活”大模型新标杆。（239字）

324 4 4

JasonAI爱街舞代码

|

5天前

|

自然语言处理 API 语音技术

|

博文

【Qwen3.5 系列技术解析】2026 年原生多模态旗舰模型全景报告

Qwen3.5是阿里2026年发布的原生多模态旗舰模型系列，覆盖0.8B至397B参数，首创Gated Delta Networks与Early Fusion架构，实现文本、图像、视频、音频端到端统一建模；9B模型性能超越前代120B，Omni版本在215项音视频基准斩获SOTA。（239字）

465 4 4

modelscope

|

6天前

|

人工智能运维前端开发

|

博文

Kimi K2.6开源：编码能力比肩闭源顶级模型，支持300智能体协同

Moonshot AI开源Kimi K2.6，主打长时编码、智能体协同与前端设计生成。在Terminal-Bench 2.0、SWE-Bench Pro等基准上达开源SOTA，逼近GPT-5.4与Claude Opus 4.6；智能体集群扩展至300个子智能体、4000协调步。

349 1 2

modelscope

|

7天前

|

数据采集人工智能

|

博文

OmniScience:大规模科学多模态数据集重磅上线

OmniScience是深势科技开源的科研图像理解数据集，含150万高质量“图-文-上下文”三元组、500万子图，覆盖10大科学领域。依托Uni-Parser与多模态大模型重描述，显著提升AI对科学图表的深层语义理解能力。

119 0 0

modelscope

|

7天前

|

编解码缓存负载均衡

|

博文

Nucleus-Image 17B开源：首个MoE架构文生图扩散模型，仅激活2B参数即超越Imagen 4

NucleusAI开源17B参数MoE扩散模型Nucleus-Image，首创稀疏专家架构，前向仅激活约2B参数；纯预训练即达SOTA，在GenEval等三大基准上超越Imagen 4等闭源模型，完全开源（Apache 2.0），支持商业使用。

219 6 6

1121881179234614

|

7天前

|

人工智能安全搜索推荐

|

博文

当用户不再点击链接，你的品牌靠什么被推荐？

当流量入口从搜索框转向AI对话框，传统SEO失效，GEO（生成式引擎优化）成为TOB企业获客新关键。百搜GEO（ai-geo.cn）专注帮工业科技企业构建AI可读、可信、首选的结构化知识资产，实现AI平台高引用、高可见、高转化，让专业品牌不再“隐形”。

113 2 2

游客ul4n4qhqvhsfe

|

7天前

|

机器学习/深度学习自然语言处理数据可视化

|

博文

可计算元认知文本分析在临床肿瘤学中的语义基线构建与边界信号检测 — 基于 726 篇开放获取高影响力期刊论文的系统性文本分析

临床肿瘤学文献数量急剧增长，但对其内部语义结构缺乏系统化的量化探究。本文在已建立的可计算元认知框架基础上，构建临床肿瘤学的语义基线，并对边界信号（阈值、决策节点等）进行检测，为跨学科对齐和临床决策支持提供基础数据。本研究首次为临床肿瘤学提供了系统的语义基线，证实可计算元认知框架在高影响力医学文献中的可迁移性。识别的边界信号揭示了该领域的“进展决策疗效”核心认知模块，为后续跨学科对齐（如临床基础流行病学）以及基于文本的决策支持系统提供了可操作的资源。

131 6 6

游客5ghrq7wwljqxu

|

8天前

|

JSON 监控 API

|

博文

韩国市场API技术对接指南，涵盖实时行情、历史数据、指数信息、公司详情等功能

StockTV API提供全面韩国股市数据服务，涵盖实时行情、历史K线、指数、IPO、涨跌榜及公司信息等，支持KOSPI/KOSDAQ/KONEX全市场，返回标准JSON，含WebSocket实时推送，适配韩元计价与交易时间特性。（239字）

122 5 5

游客oaksfmwbm53yq

|

8天前

|

人工智能自然语言处理机器人

|

博文

客服系统深度评测：三款标杆产品的独特价值解读

本评测聚焦三款客服系统的差异化优势：智齿科技以“全渠道AI融合”打造客户联络操作系统；亿捷云客服凭“轻量视觉交互”助力成长型企业敏捷服务；瓴羊Quick Service依托阿里生态，实现“服务即增长”的数智化跃迁。非排名，重适配。

117 5 5

modelscope

|

8天前

|

机器学习/深度学习算法机器人

|

博文

逐际动力开源 FluxVLA Engine：专为具身智能打造的标准化VLA工程底座

逐际动力开源FluxVLA Engine——面向具身智能的标准化VLA工程底座。它以统一配置、标准接口、模块解耦、加速部署为核心，解决数据碎片化、代码高耦合、仿真-真机迁移难三大瓶颈，支持VLM/VLA全栈任务，开箱即用部署于UR、ALOHA、TRON2等多平台。

121 0 0

游客3xrtpkhb3cuyi

|

9天前

|

大数据弹性计算固态存储

|

问答

ECS下载魔搭大数据集卡住

77 0 0

来自：计算机视觉版块

游客ul4n4qhqvhsfe

|

10天前

|

机器学习/深度学习自然语言处理数据可视化

|

博文

可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

背景：科学研究中的“范式”往往是隐性的、难以量化的；而研究论文正是范式的全部语言载体。目的：构建细胞生物学的语义基线，并系统检测该领域的边界信号（阈值、开关、检查点等），验证可计算元认知框架在生物学中的适用性。结论：本文首次在细胞生物学构建了系统的语义基线，证实了可计算元认知框架的跨学科可迁移性；所得到的动词术语边界词库为后续流行病学、临床医学等领域的跨域对齐提供了可复用的基准。

232 4 4

侠客工坊

|

12天前

|

人工智能运维监控

|

博文

从单机智能到分布式执行：侠客工坊基于事件驱动的百万级任务编排实践

本文介绍侠客工坊如何用Serverless事件引擎与视觉状态机（VSM）可观测性，破解万级移动端Agent的高并发调度与黑盒运维难题，实现云端智能调度、端侧语义可溯、秒级故障定位，构建企业级AI执行基建。

146 6 6

modelscope

|

12天前

|

数据采集人工智能机器人

|

博文

戴盟联合数十家头部机构，发布全球最大规模含触觉全模态物理世界数据集

4月15日，戴盟机器人发布全球最大含触觉全模态具身数据集Daimon-Infinity，年内规模将达数百万小时、近十亿条数据。首批10000小时高质量开源数据已上线魔搭社区，覆盖80+真实场景、2000+任务，显著提升模型训练效率10倍。

162 2 2

1844055523880883

|

17天前

|

数据采集人工智能自然语言处理

|

博文

人机共享技能库为基础的可控本地安全助理平台

**摘要：** 即使零token也能手机多平台联动电脑运行脚本自由安全地运行各种技能工具脚本，通过"自行预设"的关键词来触发运行脚本的方法达到绝对安全、高效、和自由完全掌控平台的碾压核心优势！打造十分适合机关单位、内网环境、私有部署场景的安全助理，选择不走云端ai通道！当然也可以自由选择本地部署的人工智能ai，即使没有ai照样能跑！比沙箱模式更加安全高效和极其节省成本的终极理想设定！ **关键词：** 本地化助手；人机协作；技能共享；隐私计算；自动化办公

107 2 2

1844055523880883

|

17天前

|

人工智能安全数据安全/隐私保护

|

问答

# 基于人脑与ai脑共享技能库工具脚本的可控本地安全助理平台研究与实现

66 0 0

Yaple

|

18天前

|

人工智能自然语言处理测试技术

|

博文

【开源】IntentOrch：意图驱动的MCP编排引擎 - 自然语言描述需求，AI自动编排MCP工具链执行

IntentOrch 是开源的意图驱动MCP编排引擎，让开发者用自然语言表达“要什么”，自动完成工具选择、流程规划与执行。支持多AI/多Server，5分钟上手，大幅提升MCP开发效率。

268 8 9

来自：自然语言处理版块

游客ul4n4qhqvhsfe

|

18天前

|

人工智能自然语言处理监控

|

博文

可计算元认知：跨领域跨语言文本分析的理论与工程框架 ——理论—方法篇

摘要跨领域对话是人类知识整合的核心难题。人文、心理学与管理学分别用不同的语言、方法与概念体系描述“困境”这一普遍人类体验，导致概念割裂、交流受阻。本文提出可计算元认知分析框架，旨在以技术手段实现跨领域、跨语言文本的系统对齐与反思性分析。框架的理论核心包括： 1. 语义连续统假设。 2. 主观向量原则。 3. 三步语义分析法（垂钓撒网熔炉），在此基础上，框架定义了元认知三要素：谬误类型分析、边界信号检测与贝叶斯网络推理，使对齐过程从单纯映射升为具备批判性的分析工具。

135 11 11

LucaJu

|

21天前

|

人工智能 JSON Java

|

博文

Spring AI Alibaba + MCP：调用MCP市场公开服务实操

本文详细讲解Spring Ai Alibaba调用MCP市场公开服务的全流程，以高德地图MCP服务为例，包含API-Key申请、客户端配置、代码实操，助力开发者快速掌握Spring Ai Alibaba与MCP服务对接技巧。

355 7 7

modelscope

|

21天前

|

人工智能测试技术 Apache

|

博文

Gemma 4 开源发布: Google 迄今最强开放模型，主打推理与 Agent 能力

Google正式开源Gemma 4系列（Apache 2.0许可），含E2B/E4B（端侧多模态）、26B MoE与31B Dense四款模型。参数效率卓越：31B位列开放模型榜第3，26B第6；边缘模型支持128K上下文、原生音视频处理，单卡/手机均可高效运行。

934 12 13

modelscope

|

21天前

|

机器学习/深度学习自然语言处理算法

|

博文

OpAgent开源：登顶 WebArena，蚂蚁集团开源全模态网页智能体

蚂蚁集团推出Web智能体OpAgent，仅凭自然语言指令即可在真实网站（如亚马逊）自主完成搜索、识别、加购等复杂操作。其采用视觉驱动理解、在线强化学习与模块化协作架构，在WebArena基准达71.6%任务成功率，刷新SOTA。已开源OpAgent-32B-INT4量化模型，显著降低推理门槛。

215 3 3

游客m5fcga5ufbfmw

|

23天前

|

问答

求助求助在这下载的大模型为啥是分卷的用不了啊求救

83 0 0

py世界

|

26天前

|

人工智能数据采集 Python

|

问答

未来几年，数据采集技术会不会被AI智能体完全替代？

136 1 0

游客du7h357f5ns6g

|

30天前

|

问答

摩搭社区提供的mcp一键部署有的可以兼容miclaw有的不可以为啥啊

107 1 0

游客pvto2xm7it6py

|

1月前

|

问答

魔塔mcp实验场对话时没有回答就结束了

268 1 0

游客5ghrq7wwljqxu

|

1月前

|

JSON API PHP

|

博文

使用PHP对接美股股票市场API 实时数据、IPO和K线（Kline）的PHP对接方案

StockTV API 面向开发者，提供美股实时行情、历史K线（5分钟至1月）、IPO日历等数据，支持HTTP/WS双接入，全接口返回标准JSON，含纽交所（ex=1）与纳斯达克（ex=2）标识。（239字）

511 8 8

1836130975985669

|

1月前

|

Web App开发

|

问答

为什么modelscope启用notebook实例之后点击查看，会提示授权码已失效，请重新尝试

120 0 0

m5rimcmakvgac

|

1月前

|

问答

MCP广场列表无法加载

127 0 0

贝锐

|

1月前

|

人工智能数据安全/隐私保护

|

博文

五分钟配好向日葵 MCP，让 AI 替你远程安装 OpenClaw！

本文详解向日葵MCP的实战配置与应用：将远程控制能力接入AI，实现“一句话操作另一台电脑”。支持截图查看桌面、自动打开浏览器搜索、远程执行命令等，无需写脚本，配置简单，即刻上手。

743 12 12

游客eut67e7llfbbc

|

1月前

|

API

|

问答

【求助】在魔搭创空间部署 CoPaw 后，找不到公网访问地址

409 0 0

游客ito7adzoso7i4

|

1月前

|

问答

要怎么在魔搭社区训练checkpoint底模（IL-XL）呢？

113 0 0

游客si3rnjix7uwnk

|

1月前

|

问答

关于Qwen3.5小模型的性能问题

378 1 0

游客ul4n4qhqvhsfe

|

1月前

|

机器学习/深度学习 JSON 自然语言处理

|

博文

DeepSeek 双百万 token 窗口对话数据的量化对比分析

本文基于第一个百万 token 窗口（以下简称窗口 1）与第二个百万 token 窗口（以下简称窗口 2）的完整对话数据，采用量化对比的方法，系统揭示两套对话在轮次、文本长度、语种构成以及估算 token 消耗方面的显著差异。研究发现，尽管窗口 2 的轮次和总字数均低于窗口 1，但其每轮对话的文本密度与估算 token 消耗显著更高。结合窗口 2 在生成 5 篇深度分析文章过程中的实际经验，本文提出“长文本生成的隐性 token 消耗”假说，并引用近期相关研究提供理论支撑。该假说为理解大模型在真实工程环境中的行为提供了新视角，也为用户在设计跨窗口连续工程时的指标控制与迁移提供了可操作的参考

350 12 13

游客3tsyukkrrpgco

|

1月前

|

问答

创空间部署Pocaw后，智能体输出的文件在哪儿呢？

212 0 0

游客mon4b6mg4kcsu

|

1月前

|

人工智能

|

问答

求一个适用于识别文本是否为AI生成的模型

226 1 0

来自：自然语言处理版块

最新

文章

视频

问答

推荐

请问modelscope上可以进行inpainting模型训练吗？如何操作呢？

移动端 RPA 的架构重构：基于多模态视觉大模型的自动化调度系统压测复盘

阿里云 AI 深度赋能｜书尖 AI 实测对比得到，升级轻量化阅读新体验

DeepSeek-V4 核心能力落地与实战应用指南：从底层机制到多智能体架构复盘

LLaDA2.0-Uni 开源: 打破 AR 桎梏，dLLM定义原生多模态统一新范式

如何做好SQL质量监控

GEO获客时代：B2B企业如何抢占AI推荐的首发席位？——以百搜科技为例

modelscope 中 通过【免费部署到魔搭推理API】部署的服务为什么访问API报错？

怎样用AI实现Word/Excel供应商调查表格的自动填充？

生产级 AI 编程助手落地实战：Qwen3.6-27B + OpenClaw 部署到阿里云 ACK

阿里云 AI 深度赋能｜书尖 AI 实测对比喜马拉雅，重塑高效听书体验

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

可计算元认知文本分析在肿瘤流行病学中的语义基线构建与边界信号检测

OpenClaw什么时候能替代【产品经理】？

Qwen3.6发布27B Dense模型，提供旗舰级编程能力，魔搭Serverless训练服务Day0支持

【Kimi K2.6技术解析】月之暗面MoE旗舰的架构原理与能力全景

【Qwen3.5 系列技术解析】2026 年原生多模态旗舰模型全景报告

Kimi K2.6开源：编码能力比肩闭源顶级模型，支持300智能体协同

OmniScience:大规模科学多模态数据集重磅上线

Nucleus-Image 17B开源：首个MoE架构文生图扩散模型，仅激活2B参数即超越Imagen 4

当用户不再点击链接，你的品牌靠什么被推荐？

可计算元认知文本分析在临床肿瘤学中的语义基线构建与边界信号检测 — 基于 726 篇开放获取高影响力期刊论文的系统性文本分析

韩国市场API技术对接指南，涵盖实时行情、历史数据、指数信息、公司详情等功能

客服系统深度评测：三款标杆产品的独特价值解读

逐际动力开源 FluxVLA Engine：专为具身智能打造的标准化VLA工程底座

ECS下载魔搭大数据集卡住

可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

从单机智能到分布式执行：侠客工坊基于事件驱动的百万级任务编排实践

戴盟联合数十家头部机构，发布全球最大规模含触觉全模态物理世界数据集

人机共享技能库为基础的可控本地安全助理平台

# 基于人脑与ai脑共享技能库工具脚本的可控本地安全助理平台研究与实现

【开源】IntentOrch：意图驱动的MCP编排引擎 - 自然语言描述需求，AI自动编排MCP工具链执行

可计算元认知：跨领域跨语言文本分析的理论与工程框架 ——理论—方法篇

Spring AI Alibaba + MCP：调用MCP市场公开服务实操

Gemma 4 开源发布: Google 迄今最强开放模型，主打推理与 Agent 能力

OpAgent开源：登顶 WebArena，蚂蚁集团开源全模态网页智能体

求助求助 在这下载的大模型为啥是分卷的 用不了啊 求救

未来几年，数据采集技术会不会被AI智能体完全替代？

摩搭社区提供的mcp一键部署 有的可以兼容miclaw有的不可以 为啥啊

魔塔mcp实验场对话时没有回答就结束了

使用PHP对接美股股票市场API 实时数据、IPO和K线（Kline）的PHP对接方案

为什么modelscope启用notebook实例之后点击查看，会提示授权码已失效，请重新尝试

MCP广场列表无法加载

五分钟配好向日葵 MCP，让 AI 替你远程安装 OpenClaw！

【求助】在魔搭创空间部署 CoPaw 后，找不到公网访问地址

要怎么在魔搭社区训练checkpoint底模（IL-XL）呢？

关于Qwen3.5小模型的性能问题

DeepSeek 双百万 token 窗口对话数据的量化对比分析

创空间部署Pocaw后，智能体输出的文件在哪儿呢？

求一个适用于识别文本是否为AI生成的模型

ModelScope模型即服务

活跃用户

相关产品

modelscope 中通过【免费部署到魔搭推理API】部署的服务为什么访问API报错？

求助求助在这下载的大模型为啥是分卷的用不了啊求救

摩搭社区提供的mcp一键部署有的可以兼容miclaw有的不可以为啥啊

DeepSeek 双百万 token 窗口对话数据的量化对比分析