ModelScope模型即服务-最新-第20页-阿里云开发者社区

安全风信子

|

8月前

|

Prometheus 监控 Cloud Native

|

博文

72_监控仪表盘：构建LLM开发环境的实时观测系统

在2025年的大模型(LLM)开发实践中，实时监控已成为确保模型训练效率和生产部署稳定性的关键环节。与传统软件开发不同，LLM项目面临着独特的监控挑战

609 0 0

安全风信子

|

8月前

|

机器学习/深度学习 PyTorch TensorFlow

|

博文

66_框架选择：PyTorch vs TensorFlow

在2025年的大语言模型（LLM）开发领域，框架选择已成为项目成功的关键决定因素。随着模型规模的不断扩大和应用场景的日益复杂，选择一个既适合研究探索又能支持高效部署的框架变得尤为重要。PyTorch和TensorFlow作为目前市场上最主流的两大深度学习框架，各自拥有独特的优势和生态系统，也因此成为开发者面临的经典选择难题。

1554 0 0

安全风信子

|

8月前

|

缓存 API 调度

|

博文

70_大模型服务部署技术对比：从框架到推理引擎

在2025年的大模型生态中，高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂，如何在有限的硬件资源下实现高性能、低延迟的推理服务，成为了所有大模型应用开发者面临的核心挑战。

1006 0 0

安全风信子

|

8月前

|

机器学习/深度学习数据采集自然语言处理

|

博文

99_监督微调：Alpaca数据集格式与实现

在大语言模型（LLM）的开发和应用中，微调是将通用预训练模型转化为特定任务专家的关键步骤。监督微调（Supervised Fine-Tuning, SFT）作为微调的一种重要范式，通过人工标注的高质量数据集指导模型学习特定任务的输入输出模式，从而显著提升模型在目标任务上的性能。

1523 0 0

安全风信子

|

8月前

|

人工智能监控安全

|

博文

91_提示注入：安全提示工程

随着大型语言模型（LLM）技术的快速发展和广泛应用，AI系统正以前所未有的方式改变着我们的工作和生活。然而，这种强大的技术也带来了新的安全挑战，其中提示注入（Prompt Injection）攻击已成为最具威胁性的安全问题之一。提示注入攻击通过精心构造的输入，操纵或欺骗AI系统执行非预期行为，可能导致数据泄露、权限绕过、输出不当内容等严重后果

1182 0 0

安全风信子

|

8月前

|

机器学习/深度学习人工智能监控

|

博文

93_安全提示：过滤有害内容

随着大型语言模型(LLM)在各个领域的广泛应用，确保其安全性和可靠性已成为技术社区关注的焦点。2024-2025年，随着LLM能力的不断增强，其潜在风险也日益凸显。有害内容的生成和传播不仅可能造成社会危害，还会对企业和用户带来严重的法律和声誉风险。因此，构建强健的内容过滤机制已成为LLM应用部署的必要条件。

865 0 0

安全风信子

|

8月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

在大语言模型（LLM）应用中，提示工程已成为提升模型性能和控制输出的关键技术。然而，随着模型能力的增强和应用场景的复杂化，提示文本往往变得冗长，导致token消耗急剧增加。这不仅直接影响到API调用成本，还可能超出模型的上下文窗口限制，特别是在使用GPT-4、Claude 3等大模型时，每1000个token的成本可能高达数美分。对于需要频繁交互或批量处理的应用场景，如客服系统、内容生成平台或自动化工作流，token消耗的优化就显得尤为重要。

1495 0 0

安全风信子

|

8月前

|

机器学习/深度学习数据采集人工智能

|

博文

100_RLHF（人类反馈强化学习）原理与实践

在大型语言模型（LLM）的发展历程中，我们见证了模型从简单的文本生成工具，逐渐演变为能够理解复杂指令、进行多轮对话、甚至展示创造性思维的智能系统。然而，这一进化并非仅仅依靠模型规模的增大和数据量的增加，更重要的是训练方法的创新。其中，人类反馈强化学习（Reinforcement Learning from Human Feedback, RLHF）作为一种革命性的训练范式，在2022年随着ChatGPT的问世而广受关注，并在随后的GPT-4、Claude、Gemini等先进模型中得到广泛应用。

966 3 3

安全风信子

|

8月前

|

存储人工智能自然语言处理

|

博文

96_主动学习提示：用户反馈驱动优化

在人工智能快速发展的今天，大型语言模型（LLM）已经成为各行各业的核心工具。然而，如何让LLM能够持续学习和适应新的需求，如何从用户交互中获取有价值的信息来优化模型性能，已经成为当前研究和应用的热点。主动学习提示（Active Learning Prompts）作为一种新型的提示工程技术，通过用户反馈的闭环系统，实现了模型能力的持续优化和提升。

404 0 0

安全风信子

|

8月前

|

存储数据采集人工智能

|

博文

97_微调基础：全参数 vs LoRA

在2025年的大模型时代，微调技术已经成为将通用大语言模型（LLM）适配到特定领域和任务的核心技术手段。随着模型规模的不断膨胀——从早期的数十亿参数到如今的数千亿甚至万亿参数，如何在有限的计算资源下高效地微调大模型，成为AI工程师面临的关键挑战。本文将深入探讨两种主流的微调方法：全参数微调和LoRA（Low-Rank Adaptation）低秩适应微调，从原理、技术实现、资源需求、性能表现等多个维度进行全面对比分析，帮助读者在实际项目中做出最优的技术选择。

1091 0 0

安全风信子

|

8月前

|

数据采集机器学习/深度学习自然语言处理

|

博文

98_数据增强：提升LLM微调效果的关键技术

在大语言模型（LLM）的微调过程中，数据质量与数量往往是决定最终性能的关键因素。然而，获取高质量、多样化且标注准确的训练数据却常常面临诸多挑战：数据标注成本高昂、领域特定数据稀缺、数据分布不均等问题都会直接影响微调效果。在这种背景下，数据增强技术作为一种能够有效扩充训练数据并提升其多样性的方法，正发挥着越来越重要的作用。

771 1 1

安全风信子

|

8月前

|

人工智能缓存自然语言处理

|

博文

95_跨任务提示：一次提示完成多种任务

在大语言模型（LLM）应用开发中，我们常常面临需要处理多个相关任务的场景。传统方法是为每个任务单独设计提示并调用API，这不仅增加了开发复杂度，还会导致token消耗增加和响应延迟累积。跨任务提示（Multi-Task Prompting）作为一种高效的提示工程技术，能够在单个提示中集成多个相关任务，让LLM一次调用完成多种处理需求。

280 0 0

安全风信子

|

8月前

|

机器学习/深度学习人工智能芯片

|

博文

42_大语言模型的计算需求：从GPU到TPU

随着2025年大语言模型技术的持续突破和规模化应用，计算资源已成为推动AI发展的关键驱动力。从最初的CPU计算，到GPU加速，再到专用AI加速器的崛起，大语言模型的计算需求正在重塑全球数据中心的基础设施架构。当前，全球AI半导体市场规模预计在2027年将达到2380亿美元（基本情境）甚至4050亿美元（乐观情境），这一增长背后，是大语言模型对计算能力、内存带宽和能效比的极致追求。

1028 0 0

安全风信子

|

8月前

|

人工智能自然语言处理安全

|

博文

43_PaLM与Gemma：谷歌LLM演进

在人工智能发展的浪潮中，谷歌一直扮演着关键的技术引领者角色。从最初的神经机器翻译到如今的通用人工智能，谷歌通过持续的技术创新推动着自然语言处理领域的边界不断拓展。2022年，谷歌推出了革命性的PaLM（Pathways Language Model），这一模型不仅在规模上达到了前所未有的5400亿参数，更重要的是其采用了创新的Pathways训练方法，为大型语言模型的发展开辟了新路径。随后，谷歌又推出了Gemma系列开源模型，将先进的AI技术普惠给更广泛的开发者社区。

450 2 2

modelscope

|

9月前

|

机器学习/深度学习并行计算小程序

|

博文

DeepSeek-V3.2-Exp 发布，训练推理提效，API 同步降价

今天，我们正式发布 DeepSeek-V3.2-Exp 模型，这是一个实验性（ Experimental）的版本。作为迈向新一代架构的中间步骤，V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention（一种稀疏注意力机制…

1018 0 0

modelscope

|

9月前

|

自然语言处理机器人图形学

|

博文

腾讯混元图像3.0正式开源发布！80B，首个工业级原生多模态生图模型

腾讯混元图像3.0，真的来了——开源，免费开放使用。正式介绍一下：混元图像3.0（HunyuanImage 3.0），是首个工业级原生多模态生图模型，参数规模80B，也是目前测评效果最好、参数量最大的开源生图模型，效果可对…

1893 2 3

modelscope

|

9月前

|

机器学习/深度学习数据采集人工智能

|

博文

Tongyi DeepResearch的技术报告探秘

引言阿里通义实验室悄悄（其实动静不小）发布了一个叫 Tongyi DeepResearch 的 Agent 项目。它没有开发布会，没请明星站台，甚至没发通稿——但它在 GitHub 上架当天，就登顶了“每日趋势榜”。这速度，比人类发现…

1183 2 2

modelscope

|

9月前

|

存储人工智能文字识别

|

博文

PDF解析迎来技术革新！阿里新产品实现复杂文档端到端结构化处理

前言9月24日云栖大会现场，由阿里巴巴爱橙科技数据技术及产品团队自主研发的 PDF解析神器正式亮相并同步开源模型。这款基于Logics-Parsing模型构建的AI工具直指当前PDF解析领域的技术痛点，显著提升复杂文档的结构…

1377 0 0

modelscope

|

9月前

|

人工智能数据处理云栖大会

|

博文

云栖现场｜让评测与标注成为AI进化引擎！阿里发布全新评测平台，3大创新评测集亮相

1252 9 9

modelscope

|

9月前

|

缓存自然语言处理并行计算

|

博文

腾讯自研 FastMTP 重磅开源：推理速度暴涨 203%，消费级显卡也能跑出无损速度翻倍！

854 2 2

modelscope

|

9月前

|

分布式计算测试技术 Spark

|

博文

科大讯飞开源星火化学大模型、文生音效模型

近期，科大讯飞在魔搭社区（ModelScope）和Gitcode上开源两款模型：讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly，助力前沿化学技术研究，以及声音生成技术和应用的探索。

775 2 2

modelscope

|

9月前

|

机器学习/深度学习缓存测试技术

|

博文

LongCat-Flash-Thinking 正式发布，更强、更专业，保持极速！

318 0 0

modelscope

|

9月前

|

人工智能安全开发者

|

博文

全网寻！魔搭社区×小红书科技「模法师创造营」等你加入！

寻找和魔搭、@科技薯并肩同行的「模」法师代码之外，一起成为技术布道师！

223 1 1

游客l3xey3fo3mu5c

|

9月前

|

API 网络安全

|

问答

调用Dashscope接口时报错

911 1 0

游客o5rmtmoxqsyhq

|

9月前

|

定位技术

|

问答

MCP同步问题

153 0 0

游客mzpgiv5si4crw

|

9月前

|

问答

Code Scratch功能调用

209 0 0

秦水一时了-20385

|

9月前

|

问答

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

2525 1 0

robotliu0327_nwhel

|

9月前

|

问答

如何升级vscode-server中版本

327 0 0

qianluxi

|

9月前

|

前端开发 API JavaScript

|

问答

modelscope创空间用gradio模式，如何直接使用自己设计的前端index

285 0 0

游客46lpqmadeumoq

|

9月前

|

算法容器异构计算

|

问答

model scope硬件配置咨询

208 0 0

aliyun0432730855

|

9月前

|

开发者

|

问答

下载完整的模型库后应该怎么微调

406 0 0

游客4i6pahziwllxs

|

9月前

|

问答

普通轻薄本能跑哪些多模态大模型

475 1 0

来自：多模态版块

modelscope

|

9月前

|

人工智能编解码自然语言处理

|

博文

重磅更新！ModelScope FlowBench 支持视频生成 + 图像编辑，AI创作全面升级！

很高兴地向大家宣布，ModelScope FlowBench 客户端迎来重大功能升级！本次更新不仅正式支持了视频节点功能，还新增了图像编辑与IC-Light智能打光等实用功能，同时对多个图像处理节点进行了深度优化和扩展。现在，您只需在 FlowBench 中轻松串联节点，即可使用 Wan2.1/Wan2.2、Qwen-Image-Edit、FLUX Kontext、IC-Light等强大模型，轻松实现创意内容的生成与编辑。无论你是内容创作者、视觉设计师，还是AI技术爱好者，这次更新都将为你打开全新的创作边界。

1160 14 14

游客mzpgiv5si4crw

|

9月前

|

问答

怎么基于ModelScope-Agent搭建一个很简单的智能体？

365 1 0

游客nzamowglvshz6

|

9月前

|

问答

模型服务里免费部署的模型休眠了怎么激活

385 1 0

游客ybhefit6xfbuk

|

9月前

|

问答

想咨询下魔塔官方镜像何时可以更新支持50系显卡运行的版本？

186 1 0

modelscope

|

9月前

|

人工智能物联网 API

|

博文

ModelScope魔搭25年9月发布月报

814 10 10

modelscope

|

9月前

|

人工智能

|

博文

四大公益场景，20万奖金！AI开源公益创新挑战赛邀你一起「小有可为」

538 8 8

游客46lpqmadeumoq

|

9月前

|

异构计算

|

问答

资源部署与调用相关技术咨询

454 0 0

已解决

modelscope

|

9月前

|

编解码文字识别自然语言处理

|

博文

腾讯混元生图模型升级2.1版本：支持写字、2k分辨率，开源！

551 14 14

modelscope

|

9月前

|

调度开发者异构计算

|

博文

冠军10万美金！AMD 2025 分布式推理算子优化挑战赛来了

642 13 13

modelscope

|

9月前

|

人工智能数据可视化定位技术

|

博文

不会编程也能体验的 AI 魔法，外滩大会代码原生地等你解锁

579 39 40

modelscope

|

9月前

|

人工智能算法数据挖掘

|

博文

魔搭社区携手AFAC2025金融智能创新大赛，共同孵化金融科技新星

8月27日，在上海市科学技术委员会指导下，由北京大学、清华大学、复旦大学、香港大学、蚂蚁集团等近30家海内外顶级院校、头部企业、孵化器等机构联合发起的AFAC2025金融智能创新大赛总决赛路演圆满结束。

434 9 9

modelscope

|

9月前

|

机器学习/深度学习数据采集人工智能

|

博文

通义实验室Mobile-Agent-v3开源，全平台SOTA的GUI智能体，支持手机电脑等多平台交互

近日，通义实验室MobileAgent团队正式开源全新图形界面交互基础模型 GUI-Owl，并同步推出支持多智能体协同的自动化框架 Mobile-Agent-v3。该模型基于Qwen2.5-VL打造，在手机端与电脑端共8个GUI任务榜单中全面刷新开源模型性能纪录，达成全平台SOTA。

2779 2 2

游客56v34wr7wgecc

|

9月前

|

存储数据处理数据库

|

博文

公募REITs公告PDF文档处理项目

本项目是一个专门用于处理基础设施公募REITs（Real Estate Investment Trusts）公告PDF文件的完整RAG数据处理管道，也适用于其他公告PDF文件，应用多模态大模型，可高效提升文本提取内容。系统能够自动化地将PDF公告文档转换为结构化数据，能够检测表格、实现跨页表格拼接，并将表格内容还原为便于检索的文本信息。并构建向量数据库和 Elasticsearch 以支持智能检索与问答系统。

320 8 8

游客56v34wr7wgecc

|

9月前

|

人工智能关系型数据库数据库

|

博文

公募REITs专属AI多智能体查询分析项目

公募REITs专属AI多智能体查询分析项目。本项目是基于 OpenAI Agent 框架的多智能体项目，提供二级市场数据查询分析、招募说明书内容检索、公告信息检索、政策检索等多板块查询服务。支持图标绘制、文件生成。

453 2 3

modelscope

|

9月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

B站开源IndexTTS2，用极致表现力颠覆听觉体验

在语音合成技术不断演进的背景下，早期版本的IndexTTS虽然在多场景应用中展现出良好的表现，但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题，并进一步推动零样本语音合成在实际场景中的落地能力，B站语音团队对模型架构与训练策略进行了深度优化，推出了全新一代语音合成模型——IndexTTS2 。

3903 62 72

南瓜佬

|

9月前

|

人工智能安全 Devops

|

博文

AI 驱动的 DevOps：通过智能命令执行实现基础设施自动化

本文探讨了如何利用能够根据自然语言提示执行命令、管理基础设施和自动部署的 AI 技术，来革新 DevOps 流程。通过模型上下文协议（MCP），AI 助手不仅能回答问题，还能直接操作终端、编辑文件并管理开发环境，从而简化复杂的 DevOps 任务，提高效率并降低错误率。

742 3 3

南瓜佬

|

9月前

|

Kubernetes Devops Docker

|

博文

Kubernetes 和 Docker Swarm：现代 DevOps 的理想容器编排工具

本指南深入解析 Kubernetes 与 Docker Swarm 两大主流容器编排工具，涵盖安装、架构、网络、监控等核心维度，助您根据团队能力与业务需求精准选型，把握云原生时代的技术主动权。

807 115 115

南瓜佬

|

9月前

|

Kubernetes Devops API

|

博文

从零到面试高手：每个 DevOps 专业人士都必须知道的 20 个 Kubernetes 架构问答

Kubernetes 是当前 DevOps、云原生和 SRE 领域的关键技能。本文总结了 20 个高频面试问题，涵盖架构组件、工作原理及核心概念，助你轻松掌握 Kubernetes 基础，提升面试与实战能力。

456 2 2

最新

文章

视频

问答

推荐

72_监控仪表盘：构建LLM开发环境的实时观测系统

66_框架选择：PyTorch vs TensorFlow

70_大模型服务部署技术对比：从框架到推理引擎

99_监督微调：Alpaca数据集格式与实现

91_提示注入：安全提示工程

93_安全提示：过滤有害内容

94_提示压缩：减少token消耗

100_RLHF（人类反馈强化学习）原理与实践

96_主动学习提示：用户反馈驱动优化

97_微调基础：全参数 vs LoRA

98_数据增强：提升LLM微调效果的关键技术

95_跨任务提示：一次提示完成多种任务

42_大语言模型的计算需求：从GPU到TPU

43_PaLM与Gemma：谷歌LLM演进

DeepSeek-V3.2-Exp 发布，训练推理提效，API 同步降价

腾讯混元图像3.0正式开源发布！80B，首个工业级原生多模态生图模型

Tongyi DeepResearch的技术报告探秘

PDF解析迎来技术革新！阿里新产品实现复杂文档端到端结构化处理

云栖现场｜让评测与标注成为AI进化引擎！阿里发布全新评测平台，3大创新评测集亮相

腾讯自研 FastMTP 重磅开源：推理速度暴涨 203%，消费级显卡也能跑出无损速度翻倍！

科大讯飞开源星火化学大模型、文生音效模型

LongCat-Flash-Thinking 正式发布，更强、更专业，保持极速！

全网寻！魔搭社区×小红书科技「模法师创造营」等你加入！

调用Dashscope接口时报错

MCP同步问题

Code Scratch功能调用

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

如何升级vscode-server中版本

modelscope创空间用gradio模式，如何直接使用自己设计的前端index

model scope硬件配置咨询

下载完整的模型库后应该怎么微调

普通轻薄本能跑哪些多模态大模型

重磅更新！ModelScope FlowBench 支持视频生成 + 图像编辑，AI创作全面升级！

怎么基于ModelScope-Agent搭建一个很简单的智能体？

模型服务里免费部署的模型休眠了怎么激活

想咨询下魔塔官方镜像何时可以更新支持50系显卡运行的版本？

ModelScope魔搭25年9月发布月报

四大公益场景，20万奖金！AI开源公益创新挑战赛邀你一起「小有可为」

资源部署与调用相关技术咨询

腾讯混元生图模型升级2.1版本：支持写字、2k分辨率，开源！

冠军10万美金！AMD 2025 分布式推理算子优化挑战赛来了

不会编程也能体验的 AI 魔法，外滩大会代码原生地等你解锁

魔搭社区携手AFAC2025金融智能创新大赛，共同孵化金融科技新星

通义实验室Mobile-Agent-v3开源，全平台SOTA的GUI智能体，支持手机电脑等多平台交互

公募REITs公告PDF文档处理项目

公募REITs专属AI多智能体查询分析项目

B站开源IndexTTS2，用极致表现力颠覆听觉体验

AI 驱动的 DevOps：通过智能命令执行实现基础设施自动化

Kubernetes 和 Docker Swarm：现代 DevOps 的理想容器编排工具

从零到面试高手：每个 DevOps 专业人士都必须知道的 20 个 Kubernetes 架构问答

ModelScope模型即服务

活跃用户

相关产品