ModelScope模型即服务-最新-第4页-阿里云开发者社区

modelscope

|

2月前

|

人工智能搜索推荐 API

|

博文

FlashLabs 正式发布 Chroma 1.0 - 全球首个开源、端到端、实时语音到语音 AI 模型 → 支持个性化语音克隆

FlashLabs 发布全球首个开源、端到端、实时语音到语音 AI 模型 Chroma 1.0，支持低延迟（TTFT \x26lt; 150ms）、高保真语音克隆与强对话能力，旨在成为 OpenAI Realtime API 的开源替代方案。

321 3 3

pnoi6nrtb7smq

|

2月前

|

JavaScript 前端开发

|

博文

前端新手练习纯js原生做轮播图的感悟

做轮播的要点

119 4 4

小刘的大模型笔记

|

2月前

|

机器学习/深度学习人工智能 JSON

|

博文

大模型微调实战：从原理到落地的完整指南

本文系统讲解大模型微调的原理与实战，涵盖LoRA等高效方法，手把手教你用少量数据定制专属模型，结合数据准备、训练策略与效果评估，助力开发者低成本实现AI应用落地。

413 11 12

modelscope

|

2月前

|

机器学习/深度学习文字识别测试技术

|

博文

10B击败200B！阶跃星辰10B视觉语言SOTA模型开源

阶跃星辰发布开源多模态小模型Step3-VL-10B，仅10B参数却媲美百亿级大模型，在视觉感知、逻辑推理、数学竞赛等任务中达同规模SOTA，支持端侧部署，推动智能终端交互革新。

260 6 6

huizhudev

|

2月前

|

存储人工智能缓存

|

博文

别再把大脑当成 /dev/null 了！用这套AI指令给记忆装个 "Redis 缓存层"

本文将大脑记忆比作数据库存储，指出传统记忆的"无索引"缺陷。通过一套"记忆架构师AI指令"，利用数据预处理、建立索引和持久化策略（遗忘曲线），帮助开发者构建高效、稳固的知识记忆系统，实现认知的"架构升级"。

443 4 4

大哉乾元00

|

2月前

|

异构计算

|

问答

【请问】使用modelscope模型服务部署GPU模型，vllm的参数如何设置

122 0 0

小刘的大模型笔记

|

2月前

|

机器学习/深度学习自然语言处理算法

|

博文

大模型对齐实战：PPO算法的原理与应用实践

本文深入浅出讲解PPO算法在大模型偏好对齐中的应用，涵盖核心原理、三大环节（SFT、RM、PPO）、实操步骤与效果评估。结合LLaMA-Factory工具，手把手带新手完成智能客服模型微调，助力打造贴合人类偏好的AI应用，是入门强化学习对齐的实用指南。

350 17 18

modelscope

|

2月前

|

测试技术 API

|

博文

小而强，GLM-4.7-Flash开源

GLM-4.7-Flash正式开源，30B总参、3B激活参数，兼顾性能与效率，支持免费调用。在编程、中文写作、翻译等多场景表现优异，已上线智谱平台，替代GLM-4.5-Flash，提供全新轻量化部署选择。

1165 1 1

游客za75ozwhro4z6

|

2月前

|

问答

多智能体军事协同系统：智能化防务体系中的关键技术框架

多智能体军事协同系统是智能化防务的重要理论方向，通过分布式感知、决策一致与协同控制，构建高效、鲁棒的系统协同模型。本文从概念、技术基础到发展趋势进行系统解析，探讨其在提升整体作战效能、推动系统智能演进中的理论价值，为相关研究提供参考。（238字）

207 2 2

bit0rain

|

2月前

|

异构计算

|

问答

在人工智能技术快速发展的今天，AI Agent系统已成为实现复杂任务协作的重要架构。ooderAgent（全称ooder SuperAgent）作为一套基于MIT协议的开源企业级AI能力分发与自动化协作框架，通过创新的Agent架构和SKILL管理机制，为企业提供了从简单任务到复杂流程的全场景自动化解决方案。该框架由ooder团队开发，采用SpringCloud分布式架构，于2026年1月发布最新版本v0.6.2，目前已在企业级AI应用领域展现出重要的技术价值。本研究旨在全面剖析ooderAgent框架的技术特点与技术价值，重点关注其在技术架构设计、应用能力边界、技术创新突破以及商业价值创造

456 0 2

白色桔梗

|

2月前

|

人工智能开发框架安全

|

博文

LLM驱使智能体：从概念、原理到落地实践的完整技术科普指南

随着大语言模型发展，AI正从被动响应迈向主动执行。LLM驱使智能体以大模型为核心决策引擎，通过“推理—行动—反馈”闭环，实现目标导向的自主任务执行，具备动态决策、持续运行与复杂环境适应能力。其在办公自动化、软件开发、知识工作等场景广泛应用，正成为连接大模型能力与现实任务的关键桥梁，推动智能系统向更高阶形态演进。

206 5 5

modelscope

|

2月前

|

JSON 人工智能 API

|

博文

从对话到Agent：大模型工具调用能力的量化评测

大模型向Agent进化，工具调用是关键。本文介绍EvalScope评测框架，通过双重验证机制，量化评估模型“会不会用、能不能用好”工具，助力开发者打造可靠AI应用。

299 4 4

游客hf6xcejgw6okw

|

2月前

|

问答

求解，wan2.1UNET专属节点在哪可以下载？

65 0 0

huizhudev

|

2月前

|

人工智能安全搜索推荐

|

博文

你的错题本里藏着金矿，但你却只把它当成了回收站——用AI给大脑做一次深度Debug

把学习比作软件开发，错题就是Bug。大多数人只改答案（打补丁），却忽略了底层的逻辑漏洞。本文分享一套"错题分析AI指令"，利用Root Cause Analysis（根因分析）思维，帮助你用AI深度Debug大脑，将每一个错误转化为认知的核心资产。

244 2 2

游客3emtg6sopmche

|

2月前

|

问答

大佬们，用什么模型可以检测出图片是否有PS痕迹，求推荐！或者是什么模型底座适合训练出这种模型？

172 0 0

modelscope

|

2月前

|

机器学习/深度学习存储人工智能

|

博文

国内首个全国产化千亿参数细粒度 MoE：开源！

TeleChat3-105B-A4.7-Thinking，国内首个全国产化千亿参数细粒度MoE大模型，开源！代码、数学、Agent等多能力比肩头部，支持高效任务拆解与代码生成。

246 2 2

modelscope

|

2月前

|

编解码物联网测试技术

|

博文

FLUX.2-Klein 4B/9B开源：亚秒级统一图像生成与编辑

Black Forest Labs开源FLUX.2 [klein]模型家族，兼具文生图、图像编辑与多参考生成能力，端到端推理低至0.5秒，4B版本仅需13GB显存，支持消费级GPU高效运行，量化后速度提升最高2.7倍，Apache 2.0许可商用友好。

1454 1 1

modelscope

|

2月前

|

机器学习/深度学习安全测试技术

|

博文

美团 LongCat-Flash-Thinking-2601 发布，工具调用能力登顶开源 SOTA！

美团LongCat团队发布并开源LongCat-Flash-Thinking-2601，升级支持“重思考模式”，在智能体搜索、工具调用等任务中达开源SOTA。具备强泛化与抗噪能力，支持在线免费体验，助力开发者高效落地复杂应用场景。

293 1 1

modelscope

|

2月前

|

API 语音技术

|

博文

阶跃星辰原生语音推理模型登顶全球权威语音模型榜！开源！

阶跃星辰开源语音推理模型Step-Audio-R1.1登顶全球权威榜单，以96.4%准确率超越Grok、Gemini等，支持“边说边思考”，实现高智能实时交互，现已开放体验。

226 1 2

游客frwjvlzyati3g

|

2月前

|

人工智能算法框架/工具 PyTorch

|

问答

使用modelscope使用ROCm上运行大模型测试时的out of memory问题

102 0 0

游客4d7nidhe5yrva

|

2月前

|

并行计算监控安全

|

博文

高效 GPU 加速：DeepSeek-R1 系列模型在 llama.cpp 上的生产级部署指南

本文详解如何在RTX 30/40系显卡上，通过llama.cpp高效部署DeepSeek-R1-8B模型。涵盖CUDA镜像选择、GPU卸载调优、显存控制与高可用架构，结合Docker、Prometheus监控及负载均衡，实现低延迟、高吞吐的生产级推理，助力大模型落地应用。

643 6 6

huizhudev

|

2月前

|

人工智能机器人程序员

|

博文

去年我用一张Excel表"规划"学习，结果把自己逼进了ICU——直到我学会让AI帮我排兵布阵

本文以作者因"完美计划表"累倒入院的亲身经历切入，分享了一套让AI担任私人学习规划师的完整指令模板。通过"目标拆解""遗忘曲线复习""弹性时间"三大机制，解决目标模糊、复习逃避、计划崩溃等常见学习痛点，并提供上班族、学生、转行者三种典型场景的实战案例。

366 18 18

modelscope

|

2月前

|

安全测试技术 API

|

博文

MiniMax 开源新评测集：定义Coding Agent 的生产级标准

Coding Agent常因“过程违规”遭诟病，如无视指令、破坏规范。MiniMax推出OctoCodingBench，首创面向工程可靠性的过程评估体系，揭示当前模型在多规则协同下成功率极低，呼吁行业关注“过程正确性”，推动Agent从能用走向可用。

431 5 5

AI未闻花名

|

2月前

|

人工智能自然语言处理 PyTorch

|

博文

构建AI智能体：九十四、Hugging Face 与 Transformers 完全指南：解锁现代 NLP 的强大力量

Hugging Face 是领先的自然语言处理开源平台，提供 Transformers 等核心库，支持数千种预训练模型，涵盖文本分类、生成、问答等任务。其 Pipeline 工具简化了模型调用，AutoClass 实现架构自动识别，助力开发者高效构建 AI 应用。

667 10 12

ix5jf3noysme2

|

2月前

|

API 异构计算

|

问答

现在还能免费部署模型至api上了吗？

395 1 0

modelscope

|

2月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

AgentCPM-Explore开源，4B 参数突破端侧智能体模型性能壁垒

清华、人大、面壁智能与OpenBMB联合推出4B参数智能体模型AgentCPM-Explore，在8大长程任务上实现同尺寸SOTA，性能比肩30B+大模型。支持百轮稳定交互、全流程开源，重塑端侧AI潜能。

354 7 7

游客dkgoztfbw6mik

|

2月前

|

问答

在使用modelscope增说的虚拟机时，不小心卸载了modelscope库。

70 0 0

huizhudev

|

2月前

|

人工智能定位技术

|

博文

不读完这3000篇文献就没法写论文？你的"穷举法"正在拖垮你的科研生涯

针对科研人员面临的"文献海量增长"困境，本文提出了一种基于系统性综述方法论的AI指令方案。通过"认知跃迁"和"三种实战模式"，帮助研究者从机械阅读转向精密过滤，利用AI构建高质量的学术综述框架。

207 8 9

游客77ikadlqxugne

|

2月前

|

人工智能 JavaScript 搜索推荐

|

博文

AI Agent MCP 源代码部署Deployment 获得子域名Live URL的0-1教程

本文介绍如何将AI Agent或MCP服务部署上线，获取免费二级域名（如*.aiagenta2z.com），并在ChatGPT、Claude等客户端中直接使用。涵盖代码准备、入口命令配置、GitHub部署及调试全流程，支持Python/Node.js项目，助力开发者快速实现服务托管与集成。

289 2 2

游客oopgq52nlgwdg

|

2月前

|

运维安全 API

|

博文

内网系统IP离线数据库搭建与维护完整方案

本方案面向无外网内网环境，提供IP离线数据库全生命周期部署指南，涵盖规划、搭建、维护与应急，支持内网IP自定义映射、高并发查询与安全合规，实现数据自主可控、运维闭环，适配多规模企业架构。

235 1 1

游客f6zvqcx4a77is

|

2月前

|

API Python

|

问答

魔塔免费部署的模型访问时一直超时是什么问题，如何解决？

132 0 0

小刘的大模型笔记

|

2月前

|

监控搜索推荐物联网

|

博文

一文读懂LoRA微调原理：大模型高效适配的核心逻辑

通过冻结大模型参数、仅训练少量低秩矩阵，实现高效微调：成本低、周期短、不破坏通用能力。适配医疗、金融等垂直场景，支持多任务复用与边缘部署，成为大模型落地首选技术。

680 9 9

大模型探员

|

2月前

|

人工智能数据可视化物联网

|

博文

《显卡 4090 就能跑！小白也能炼出私有大模型》

大模型微调是AI落地的关键技术，通过定向训练让通用模型在特定领域“从会到精”。本文详解微调原理、LoRA/QLoRA等高效方法，并提供评估与实操建议，助力新手快速上手，实现低成本、高精度的模型定制。

406 4 6

modelscope

|

2月前

|

自然语言处理物联网计算机视觉

|

博文

从 Image-to-LoRA 到 In-Context Edit

阿里发布Qwen-Image-Edit-2511-ICEdit-LoRA模型，通过上下文内编辑技术，利用“编辑前后图像对”实现图像编辑能力迁移。该模型仅需少量样本即可训练，支持风格、光照、表情等复杂编辑，并可拓展至图像分割等视觉任务，未来将持续优化与应用探索。

435 6 6

modelscope

|

2月前

|

人工智能自然语言处理数据挖掘

|

博文

Qwen3-VL-Embedding & Qwen3-VL-Reranker：统一多模态表征与排序

通义千问Qwen团队于2025年1月8日推出多模态模型新成员：Qwen3-VL-Embedding与Qwen3-VL-Reranker，基于Qwen3-VL构建，支持文本、图像、视频等多模态统一表示与跨模态检索，在图文匹配、视觉问答等任务中表现卓越，具备高精度、多语言、易集成等优势，助力全球开发者构建高效多模态应用。

1589 4 4

AI未闻花名

|

2月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

构建AI智能体：九十、图解大模型核心三大件 — 输入编码、注意力机制与前馈网络层

本文深入解析了大模型三大核心技术：输入编码、多头自注意力机制和前馈网络层，从应用视角阐述了它们的工作原理和协同效应。输入编码负责将文本转换为富含语义和位置信息的数学表示；多头自注意力机制通过多专家团队模式建立全局依赖关系，解决长距离依赖问题；前馈网络层则通过非线性变换进行深度语义消歧。文章通过可视化示例展示了词向量的语义关系建模、注意力权重的分布模式以及前馈网络的语义过滤功能，形象地说明了大模型如何通过这三层架构实现"广泛联系-深度加工"的认知过程。

188 5 5

aliyun3025401976

|

2月前

|

问答

有无语音分类的相关开源预训练模型推荐？主要是识别：御姐音、萝莉音、烟嗓、少年感此类类似的

169 0 0

来自：语音版块

modelscope

|

2月前

|

数据采集自然语言处理算法

|

博文

重塑虚实边界：智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

智元机器人发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0，基于NVIDIA Isaac Sim，实现高保真数字孪生环境，支持自然语言生成万级场景，分钟级构建与泛化。平台开源上万小时真实机器人作业数据集，覆盖200+任务，构建10万+场景评估体系，推动具身智能从研发到落地的全链路创新，助力开发者零硬件部署、高效训练与评测。

286 4 4

huasio

|

2月前

|

问答

modelscope 部署模型资源好久了，一直没响应，这应该怎么删除重新部署呢？

303 1 0

芝士的海洋

|

2月前

|

API

|

问答

API inference endpoint都变成待机态了

757 13 0

modelscope

|

2月前

|

数据可视化定位技术开发工具

|

博文

榜单不盲从：用 EvalScope 打造你的专属场景评测

本文介绍如何通过EvalScope构建自定义评测指数，突破通用榜单局限，结合业务需求定义权重，实现模型在真实场景中的价值评估，助力选出真正适配业务的“最佳模型”。

425 6 6

游客thkxz5uv32ioe

|

2月前

|

Python

|

问答

modelscope 模型python调用

319 0 0

游客3rchw4qwwntw4

|

2月前

|

安全缓存

|

问答

notebook启动安全验证一直失败

978 7 0

modelscope

|

2月前

|

机器学习/深度学习测试技术数据中心

|

博文

九坤量化开源IQuest-Coder-V1，代码大模型进入“流式”训练时代

2026年首日，九坤创始团队成立的至知创新研究院开源IQuest-Coder-V1系列代码大模型，涵盖7B至40B参数，支持128K上下文与GQA架构，提供Base、Instruct、Thinking及Loop版本。采用创新Code-Flow训练范式，模拟代码演化全过程，提升复杂任务推理能力，在SWE-Bench、LiveCodeBench等基准领先。全阶段checkpoint开放，支持本地部署与微调，助力研究与应用落地。

1014 2 2

modelscope

|

2月前

|

人工智能自然语言处理运维

|

博文

业内首发泛娱乐底座大模型！元象开源XVERSE-Ent中英双模型，单卡部署超低门槛

元象开源首款聚焦泛娱乐场景的大模型XVERSE-Ent，含中英双版本，专精角色一致性、长剧情理解与多元语境适配，支持轻量化部署，助力开发者低成本打造AI社交、游戏与创意内容应用。

247 3 3

1188610797232334

|

2月前

|

供应链安全区块链

|

博文

生态协同发力！DAN仲裁网络筑牢Web3商业闭环，让信任贯穿交易全流程

OmniPact DAN仲裁网络重构Web3信任体系，打破争议解决孤岛，首创与跨链、零知识证明、SBT声誉系统深度协同的生态闭环。实现多链资产自动赔付、隐私保护下证据验证、信誉可沉淀变现，让信任贯穿交易全流程，推动Web3商业迈向无摩擦、高可信的全球协作新时代。（238字）

160 7 7

1238188867416902

|

3月前

|

问答

vllm部署模型，参数如何指定

499 0 0

来自：自然语言处理版块

游客rptpd75w3yo66

|

3月前

|

Java 调度

|

博文

什么是分片广播任务

本文介绍XXL-JOB的分片广播机制，通过集群执行器动态分片处理任务。调度中心为每个执行器分配分片参数，实现任务并行处理，提升效率。适用于大数据量分布式场景，支持动态扩容，每台机器处理部分数据，显著降低耗时。开发时可通过`getShardIndex()`和`getShardTotal()`获取分片信息，灵活控制业务逻辑。

225 3 3

最新

文章

视频

问答

推荐

FlashLabs 正式发布 Chroma 1.0 - 全球首个开源、端到端、实时语音到语音 AI 模型 → 支持个性化语音克隆

前端新手练习纯js原生做轮播图的感悟

大模型微调实战：从原理到落地的完整指南

10B击败200B！阶跃星辰10B视觉语言SOTA模型开源

别再把大脑当成 /dev/null 了！用这套AI指令给记忆装个 "Redis 缓存层"

【请问】使用modelscope模型服务部署GPU模型，vllm的参数如何设置

大模型对齐实战：PPO算法的原理与应用实践

小而强，GLM-4.7-Flash开源

个人AGENT应该怎么训练部署。

多智能体军事协同系统：智能化防务体系中的关键技术框架

魔塔GPU平台挂起

深度揭秘 ooderAgent MIT 开源框架

LLM驱使智能体：从概念、原理到落地实践的完整技术科普指南

从对话到Agent：大模型工具调用能力的量化评测

求解，wan2.1UNET专属节点在哪可以下载？

你的错题本里藏着金矿，但你却只把它当成了回收站——用AI给大脑做一次深度Debug

大佬们，用什么模型可以检测出图片是否有PS痕迹，求推荐！ 或者是什么模型底座适合训练出这种模型？

国内首个全国产化千亿参数细粒度 MoE：开源！

FLUX.2-Klein 4B/9B开源：亚秒级统一图像生成与编辑

美团 LongCat-Flash-Thinking-2601 发布，工具调用能力登顶开源 SOTA！

阶跃星辰原生语音推理模型登顶全球权威语音模型榜！开源！

使用modelscope使用ROCm上运行大模型测试时的out of memory问题

高效 GPU 加速：DeepSeek-R1 系列模型在 llama.cpp 上的生产级部署指南

去年我用一张Excel表"规划"学习，结果把自己逼进了ICU——直到我学会让AI帮我排兵布阵

MiniMax 开源新评测集：定义Coding Agent 的生产级标准

构建AI智能体：九十四、Hugging Face 与 Transformers 完全指南：解锁现代 NLP 的强大力量

现在还能免费部署模型至api上了吗？

AgentCPM-Explore开源，4B 参数突破端侧智能体模型性能壁垒

在使用modelscope增说的虚拟机时，不小心卸载了modelscope库。

不读完这3000篇文献就没法写论文？你的"穷举法"正在拖垮你的科研生涯

AI Agent MCP 源代码部署Deployment 获得子域名Live URL的0-1教程

内网系统IP离线数据库搭建与维护完整方案

魔塔免费部署的模型访问时一直超时是什么问题，如何解决？

一文读懂LoRA微调原理：大模型高效适配的核心逻辑

《显卡 4090 就能跑！小白也能炼出私有大模型》

从 Image-to-LoRA 到 In-Context Edit

Qwen3-VL-Embedding & Qwen3-VL-Reranker：统一多模态表征与排序

构建AI智能体：九十、图解大模型核心三大件 — 输入编码、注意力机制与前馈网络层

有无语音分类的相关开源预训练模型推荐？主要是识别：御姐音、萝莉音、烟嗓、少年感 此类类似的

重塑虚实边界：智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

modelscope 部署模型资源好久了， 一直没响应，这应该怎么删除重新部署呢？

API inference endpoint都变成待机态了

榜单不盲从：用 EvalScope 打造你的专属场景评测

modelscope 模型python调用

notebook启动安全验证一直失败

九坤量化开源IQuest-Coder-V1，代码大模型进入“流式”训练时代

业内首发泛娱乐底座大模型！元象开源XVERSE-Ent中英双模型，单卡部署超低门槛

生态协同发力！DAN仲裁网络筑牢Web3商业闭环，让信任贯穿交易全流程

vllm部署模型，参数如何指定

什么是分片广播任务

ModelScope模型即服务

活跃用户

相关产品

大佬们，用什么模型可以检测出图片是否有PS痕迹，求推荐！或者是什么模型底座适合训练出这种模型？

有无语音分类的相关开源预训练模型推荐？主要是识别：御姐音、萝莉音、烟嗓、少年感此类类似的

modelscope 部署模型资源好久了，一直没响应，这应该怎么删除重新部署呢？