随着大模型技术的快速发展,阿里云百炼平台已成为企业落地AI应用的重要选择。无论是使用千问系列文本模型进行微调训练,还是调用万相视频生成模型,了解清晰的计费规则都是控制成本的关键。本文将详细介绍阿里云百炼平台在模型训练与模型部署两大环节的计费规则及价格,涵盖千问、千问VL、万相等主流模型的训练单价,以及按使用时长、模型单元、实例规格等多种部署计费方式,并附上计费示例与常见问题解答,帮助您在使用平台时做到心中有数、合理规划预算。

一、模型训练计费
阿里云百炼平台目前面向所有阿里云用户,提供百余款千问系列大模型和国内优质开源三方大模型,新用户开通即享超7000万免费tokens。详情可参考:https://www.aliyun.com/product/bailian

1.1 文本生成模型-千问
说明:模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能评测和调用。
| 计费方式 | 按训练Token计费 |
|---|---|
| 计费公式 | 模型训练费用 =(训练数据 Token 总数 + 混合训练数据 Token 总数)× 循环次数 × 训练单价(最小计费单位:1 token) 您可以查看模型训练控制台底部的预估训练费用,并单击计算详情,查看训练 Token 总数、循环次数和训练单价。 |
千问
| 模型服务 | 模型规格 | 价格 |
|---|---|---|
| 千问2.5-72B | qwen2.5-72b-instruct | 0.15元/千Token |
| Qwen-Plus-character-2025-11-06 | qwen-plus-character-2025-11-06 | - |
| 千问3-32B | qwen3-32b | 0.04 元/千Token |
| 千问3-32B-Base | qwen3-32b-base | - |
| 千问3-30B-A3B-Instruct-2507 | qwen3-30b-a3b-instruct-2507 | 0.03元/千 Token |
| 千问3-14B | qwen3-14b | - |
| 千问3-14B-Base | qwen3-14b-base | - |
| 千问2.5-32B | qwen2.5-32b-instruct | - |
| 千问2.5-14B | qwen2.5-14b-instruct | - |
| 千问3-8B | qwen3-8b | 0.006元/千 Token |
| 千问3-8B-Base | qwen3-8b-base | - |
| 千问3-4B-Instruct-2507 | qwen3-4b-instruct-2507 | - |
| 千问3-4B-Base-2507 | qwen3-4b-base-2507 | - |
| 千问3-VL-4B-Instruct | qwen3-vl-4b-instruct | - |
| 千问2.5-7B | qwen2.5-7b-instruct | - |
| 千问3-1.7B | qwen3-1.7b | 0.0045元/千Token |
| 千问3-0.6B | qwen3-0.6b | 0.003元/千Token |
千问VL
| 模型服务 | 模型规格 | 价格 |
|---|---|---|
| 千问2.5-VL-72B | qwen2.5-vl-72b-instruct | 0.05 元/千Token |
| 千问2.5-VL-32B | qwen2.5-vl-32b-instruct | 0.02 元/千Token |
| 千问3-VL-8B-Instruct | qwen3-vl-8b-instruct | 0.012元/千Token |
| 千问3-VL-8B-Thinking | qwen3-vl-8b-thinking | - |
| 千问3-VL-8B-Base | qwen3-vl-8b-base | - |
| 千问2.5-VL-7B | qwen2.5-vl-7b-instruct | 0.01 元/千Token |
| 千问3-VL-1B-Base | qwen3-vl-1b-base | 0.003元/千Token |
1.2 视频生成模型-万相
说明:模型训练流程请参见模型调优。训练完成后的新模型需先完成模型部署,才能调用。
| 计费方式 | 按训练Token计费 |
|---|---|
| 计费公式 | 模型训练费用 = 训练Token总量 × 训练单价(计费单位:每千Token) |
训练Token总量的计算公式

其中:
- N:训练集中的视频总数。
- max_pixels:训练时指定的超参数,表示视频的最大像素数(创建微调任务时配置)。
- n_epochs:训练时指定的超参数,表示循环次数(创建微调任务时配置)。
- 单个视频计费时长计算规则:先将原始视频时长(秒)四舍五入取整,再根据模型限制取最终值。
- wan2.5模型:
计费时长 = min(10, 四舍五入后的时长),即单条视频最多按 10 秒计算。 - wan2.2模型:
计费时长 = min(5, 四舍五入后的时长),即单条视频最多按 5 秒计算。
- wan2.5模型:
| 模型服务 | 模型名称 | 训练价格(每千Token) |
|---|---|---|
| 万相-图生视频-基于首帧 | wan2.2-i2v-flash | 0.06元 |
| wan2.5-i2v-preview | 0.32元 | |
| 图生视频-基于首尾帧 | wan2.2-kf2v-flash | 0.06元 |
计费示例
假设训练集包含 2 条视频,时长分别为 3.4 秒 和 6.5 秒,max_pixels = 262144,n_epochs = 400,训练单价 = 0.06元/千Token:
- 时长计算:
- 视频 1:3.4 → 四舍五入 → 3 秒 → 计费时长 = min(5, 3) = 3
- 视频 2:6.5 → 四舍五入 → 7 秒 → 计费时长 = min(5, 7) = 5
- 总计费时长 = 3 + 5 = 8 秒
- 训练Token总量 = 8 ×(262144/1024)× 400 = 819200 = 819.2千Token
- 模型训练费用 = 819.2 × 0.06 = 49.152元
二、模型部署计费
2.1 文本生成模型-千问
按使用时长计费(预置吞吐)
费用 = 使用时长 × (输入 TPM 单价 × 输入 TPM + 输出 TPM 单价 × 输出 TPM)
- 预付费订单支付后实时生效,有效期 N 天至第 N 天 23:59 结束。若在 22:00 后下单,到期日将自动顺延1天。
- 预付费订单到期后,将延后2小时停止服务,停止后资源保留14小时后释放。
- 预付费订单无法提前终止服务。
- 后付费时,如果账户欠费,部署的资源将保留并继续计费 24 小时,之后自动释放资源。
当模型输入超过最长输入 Token 或 超出购买的 TPM 量时,相关调用将自动切换为当前模型的按量付费模式。此时,推理性能可能下降,限流将受业务空间中当前快照模型的公共流量的管控,费用按模型调用(按量付费)标准计收。
- 此时,调用 API 返回 Header 将包含:
x-dashscope-ptu-overflow:true。 - TPM 统计请前往:模型监控(北京)。
| 模型名称 | 模型代码 | 思考模式 | 最长输入Token限制 | 后付费-按小时-输入(Per 10k TPM) | 后付费-按小时-输出(Per 1k TPM) | 预付费-按天-输入(Per 10k TPM) | 预付费-按天-输出(Per 1k TPM) |
|---|---|---|---|---|---|---|---|
| DeepSeek-v4-pro | deepseek-v4-pro | 支持 | 64,000 | ¥43.20 | ¥8.64 | ¥518.40 | ¥103.68 |
| GLM-5.1 | glm-5.1 | 支持 | 64,000 | ¥21.60 | ¥8.64 | ¥259.20 | ¥103.68 |
| 千问3.6-Plus-2026-04-02 | qwen3.6-plus-2026-04-02 | 支持 | 128,000 | ¥4.80 | ¥2.88 | ¥57.60 | ¥34.56 |
| 千问3.5-plus-2026-04-20 | qwen3.5-plus-2026-04-20 | 支持 | 128,000 | ¥1.92 | ¥1.15 | ¥23.04 | ¥13.82 |
| 千问3-max-2025-09-23 | qwen3-max-2025-09-23 | 不支持 | 128,000 | ¥7.68 | ¥3.08 | ¥92.16 | ¥36.96 |
| 千问-plus-2025-12-01 | qwen-plus-2025-12-01 | 不支持 | - | ¥1.92 | ¥0.48 | ¥23.04 | ¥5.76 |
| 千问-plus-2025-12-01 | qwen-plus-2025-12-01 | 支持 | - | ¥1.92 | - | ¥23.04 | - |
| 千问-flash-2025-07-28 | qwen-flash-2025-07-28 | 支持 | - | ¥0.36 | ¥0.36 | ¥4.32 | ¥4.32 |
| 千问3-vl-plus-2025-09-23 | qwen3-vl-plus-2025-09-23 | 支持 | - | ¥2.40 | ¥2.40 | ¥28.80 | ¥28.80 |
| DeepSeek-v3.2 | deepseek-v3.2 | 支持 | 64,000 | ¥7.20 | ¥1.08 | ¥86.40 | ¥12.96 |
按使用时长计费(模型单元)
费用 = 使用时长(小时)× 模型单元数量 × 模型单元单价
- 预付费购买的首月,如在首月内提前退订,日单价将按 1.2 倍计费
说明:模型单元-后付费方式的算力资源先买到先得。如购买不成功会全额退款。
千问
| 模型名称 | 模型代码 | 模型类型 | 支持限流 | 模型单元规格 | 后付费-按小时 | 预付费-按天 |
|---|---|---|---|---|---|---|
| 千问3.6-Plus-2026-04-02 | qwen3.6-plus-2026-04-02 | Thinking | 支持 | I 型模型单元(MU1) | ¥432/小时 | ¥208,944/月 |
| 千问3.5-Plus-2026-02-15 | qwen3.5-plus-2026-02-15 | Instruct | 支持 | III 型模型单元(MU3) | ¥1,048/小时(PD分离模式:¥2,096/小时) | ¥504,000/月(PD分离模式:¥1,008,000/月) |
| Qwen2.5-14B-Instruct | qwen2.5-14b-instruct | Instruct | 支持 | I 型模型单元(MU1) | ¥108/小时 | ¥52,236/月 |
| GLM-5 | glm-5 | Instruct | 支持 | III 型模型单元(MU3) | ¥1,048/小时(PD分离模式:¥2,096/小时) | ¥504,000/月(PD分离模式:¥1,008,000/月) |
| 千问3.5-397B-A17B | qwen3.5-397b-a17b | Instruct | 支持 | III 型模型单元(MU3) | ¥1,048/小时(PD分离模式:¥2,096/小时) | ¥504,000/月(PD分离模式:¥1,008,000/月) |
| 千问3-Max-2025-09-23 | qwen3-max-2025-09-23 | Instruct | 支持 | II 型 / III 型模型单元(MU2/MU3) | II型:¥504/小时;III型:¥1,048/小时 | II型:¥240,288/月;III型:¥504,000/月 |
| DeepSeek-v3.2 | deepseek-v3.2 | Instruct | 支持 | II 型模型单元(MU2) | ¥504/小时(PD分离模式:¥896/小时) | ¥240,288/月(PD分离模式:¥432,000/月) |
| 千问3-235B-A22B-Instruct-2507 | qwen3-235b-a22b-instruct-2507 | Instruct | 支持 | I / II 型模型单元(MU1/MU2) | I型:¥216/小时;II型:¥448/小时 | I型:¥104,472/月;II型:¥216,000/月 |
| 千问-Plus-2025-12-01 | qwen-plus-2025-12-01 | Instruct/Thinking | 支持 | I 型模型单元(MU1) | ¥216/小时 | ¥104,472/月 |
| 千问-Plus-2025-07-28 | qwen-plus-2025-07-28 | Instruct/Thinking | 支持 | - | - | - |
| 千问-Flash-2025-07-28 | qwen-flash-2025-07-28 | Instruct/Thinking | 支持 | - | - | - |
| 千问2.5-开源版-72B | qwen2.5-72b-instruct | Instruct | 支持 | - | - | - |
| 千问2.5-开源版-32B | qwen2.5-32b-instruct | Instruct | 支持 | - | - | - |
| 千问3-32B | qwen3-32b | Instruct | 支持 | - | - | - |
| qwen3.5-35b-a3b | qwen3.5-35b-a3b | Thinking | 支持 | I 型模型单元(MU1) | ¥108/小时 | ¥52,236/月 |
| 千问3.5-9B | qwen3.5-9b | Instruct | 支持 | I 型模型单元(MU1) | ¥108/小时 | ¥52,236/月 |
| 千问3.5-27B | qwen3.5-27b | Instruct | 支持 | - | - | - |
| 千问3-Next-80B-A3B-Instruct | qwen3-next-80b-a3b-instruct | Instruct | 支持 | - | - | - |
| qwen3.5-122b-a10b | qwen3.5-122b-a10b | Thinking | 支持 | I 型模型单元(MU1) | ¥216/小时 | ¥104,472/月 |
| 千问3-4B | qwen3-4b | Instruct | 支持 | V / I 型模型单元(MU5/MU1) | V型:¥20/小时;I型:¥96/小时 | V型:¥9,500/月;I型:¥46,000/月 |
| 千问3-1.7B | qwen3-1.7b | Instruct | 支持 | V / I 型模型单元(MU5/MU1) | V型:¥20/小时;I型:¥96/小时 | V型:¥9,500/月;I型:¥46,000/月 |
| Text Embedding V4 | text-embedding-v4 | Embedding | 支持 | V 型模型单元(MU5) | ¥20/小时 | ¥9,500/月 |
| 千问2.5-开源版-3B | qwen2.5-3b-instruct | Instruct | 支持 | - | - | - |
| 千问3-Rerank | qwen3-rerank | Rerank | 支持 | - | - | - |
| 千问3-MoE-Rerank-0.6B | qwen3-moe-rerank-0.6b | Rerank | 支持 | - | - | - |
| 千问3-Rerank-0.6B | qwen3-rerank-0.6b | Rerank | 支持 | V / VI 型模型单元(MU5/MU6) | V型:¥20/小时;VI型:¥18/小时 | V型:¥9,500/月;VI型:¥8,700/月 |
| 千问3-Embedding-0.6B | qwen3-embedding-0.6b | Embedding | 支持 | VI / V 型模型单元(MU6/MU5) | VI型:¥25/小时;V型:¥20/小时 | VI型:¥12,089/月;V型:¥9,500/月 |
| MiniMax-M2.5 | MiniMax-M2.5 | Instruct | 支持 | I 型模型单元(MU1) | ¥432/小时 | ¥208,944/月 |
| kimi-k2.5 | kimi-k2.5 | Thinking | 支持 | II 型模型单元(MU2) | ¥504/小时 | ¥240,288/月 |
模型类型说明:
- Instruct - 模型部署后以非思考模式进行推理。
- Thinking - 模型部署后以思考模式进行推理。
模型部署类型说明:
- PD 分离模式 - 降低首 Token 延迟、提高吞吐。该部署模式部署的模型在进行模型推理时,将首 Token 计算(Prefill)和后续 Token 计算(Decode)两个计算阶段,拆到不同的计算节点执行。
千问VL
| 模型服务 | 模型代码 | 模型类型 | 支持限流 | 模型单元规格 | 单价(不满1分钟按1分钟计费) | 包月单价(不满1天按1天计费) |
|---|---|---|---|---|---|---|
| 千问VL-Max-2025-08-13 | qwen-vl-max-2025-08-13 | Instruct | 支持 | VI 型模型单元(MU6) | ¥100/小时 | ¥48,356/月 |
| 千问VL-OCR-2025-11-20 | qwen-vl-ocr-2025-11-20 | Instruct | 支持 | VI 型模型单元(MU6) | - | - |
| 千问3-VL-8B-Instruct | qwen3-vl-8b-instruct | Instruct | 支持 | I 型模型单元(MU1) | ¥108/小时;¥96/小时 | ¥52,236/月;¥46,000/月 |
| 千问3-VL-4B-Instruct | qwen3-vl-4b-instruct | Instruct | 支持 | - | - | - |
| 千问3-VL-Flash-2025-10-15 | qwen3-vl-flash-2025-10-15 | Instruct/Thinking | 支持 | I 型模型单元(MU1) | ¥216/小时 | ¥104,472/月 |
| 千问3-VL-Plus-2025-09-23 | qwen3-vl-plus-2025-09-23 | Instruct/Thinking | 支持 | - | - | - |
| 千问3-VL-235B-A22B-Instruct | qwen3-vl-235b-a22b-instruct | Instruct | 支持 | - | - | - |
| 千问3-VL-32B-Instruct | qwen3-vl-32b-instruct | Instruct | 支持 | - | - | - |
| 千问3-VL-Embedding-2B | qwen3-vl-embedding-2b | Embedding | 支持 | V 型模型单元(MU5) | ¥20/小时 | ¥9,500/月 |
| qwen3-vl-2b-instruct | qwen3-vl-2b-instruct | Thinking | - | V 型模型单元(MU5) | ¥20/小时 | ¥9,500/月 |
模型类型说明:
- Instruct - 模型部署后以非思考模式进行推理。
- Thinking - 模型部署后以思考模式进行推理。
- Instruct/Thinking - 可在模型部署时选择是否开启思考模式。
按模型 Token 使用量
费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最小计费单位:1 token)
- 仅当对下列基础模型完成 SFT 高效训练并得到自定义模型后,才支持按模型 Token 使用量计费。
| 基础模型 | 模型代码 | 模型类型 | 最长上下文 | 输入单价 | 输出单价 |
|---|---|---|---|---|---|
| 千问3-32B | qwen3-32b | Instruct | 固定为:131,072 | ¥0.002/千Token | 非思考模式:¥0.008/千Token;思考模式:¥0.02/千Token |
| 千问3-14B | qwen3-14b | Instruct | - | ¥0.001/千Token | 非思考模式:¥0.004/千Token;思考模式:¥0.01/千Token |
| 千问3-8B | qwen3-8b | Instruct | - | ¥0.0005/千Token | 非思考模式:¥0.002/千Token;思考模式:¥0.005/千Token |
| 千问3-VL-8B-Instruct | qwen3-vl-8b-instruct | Instruct | 固定为:131,072 | ¥0.0005/千Token | ¥0.002/千Token |
| 千问 2.5-72B | qwen2.5-72b-instruct | Instruct | 固定为:131,072 | ¥0.004/千Token | ¥0.012/千Token |
| 千问 2.5-32B | qwen2.5-32b-instruct | Instruct | - | ¥0.002/千Token | ¥0.006/千Token |
| 千问 2.5-14B | qwen2.5-14b-instruct | Instruct | - | ¥0.001/千Token | ¥0.003/千Token |
| 千问 2.5-7B | qwen2.5-7b-instruct | Instruct | - | ¥0.0005/千Token | ¥0.001/千Token |
| 千问2.5-VL-72B | qwen2.5-vl-72b-instruct | Instruct | 固定为:131,072 | ¥0.016/千Token | ¥0.048/千Token |
| 千问2.5-VL-32B | qwen2.5-vl-32b-instruct | Instruct | - | ¥0.008/千Token | ¥0.024/千Token |
| 千问2.5-VL-7B | qwen2.5-vl-7b-instruct | Instruct | - | ¥0.002/千Token | ¥0.005/千Token |
| 千问 2-开源版-7B | qwen2-7b-instruct | Instruct | 固定为:131,072 | ¥0.001/千Token | ¥0.002/千Token |
图片、视频生成模型(预置)-按实例时长计费
费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满 1 小时按 1 小时计费)
图片生成
| 模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 |
|---|---|---|---|---|
| 万相-文本生成图像-0521 | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
视频生成
| 模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 |
|---|---|---|---|---|
| 悦动人像EMO-detect | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
| 悦动人像EMO | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
| 舞动人像AnimateAnyone-detect | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
| 舞动人像AnimateAnyone | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
2.2 图像和视频生成模型(预置模型)
| 计费方式 | 计费公式 |
|---|---|
| 按实例资源占用时长计费 | 费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满1小时按1小时计费) 部署前可以在模型部署控制台查看不同模型的预估每小时费用。 |
| 实例包月计费/预付费 | 费用 = 购买时长(月)× 实例数量 × 模型对应的实例单价 购买资源:请前往模型部署控制台(单击右上角的资源池管理)购买。(资源购买完成后便开始计费) 退订资源:请前往主账号的退订管理退订。退订后,将根据未用时长退回未使用金额。(不满1天按1天计费) |
2.3 图片生成
| 模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 |
|---|---|---|---|---|
| 万相-文本生成图像-0521 | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
2.4 视频生成
| 模型服务 | 模型类型 | 独占实例资源规格 | 后付费单价 | 预付费单价 |
|---|---|---|---|---|
| 悦动人像EMO-detect | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
| 悦动人像EMO | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
| 舞动人像AnimateAnyone-detect | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
| 舞动人像AnimateAnyone | 预置模型 | 轻量版 | ¥20/实例/小时 | ¥10,000/月 |
三、常见问题
Q:模型部署什么时候开始计费?
A:当模型完成部署,即状态为运行中时,开始收取模型部署的费用。模型状态为部署中、欠费、部署失败时,均不会计费。
如果是包月预付费,模型状态为运行中后,开始消耗包月时间。
Q:取消模型训练会收费么?
A:会收费。如果您主动取消训练,之前已产生的费用仍会被计算。其他原因导致的训练中断,阿里云百炼不会向您收取训练费用。
Q:怎么查看已部署模型的调用统计?
A:请访问模型监控(北京)、模型监控(弗吉尼亚)、模型监控(新加坡)页面。

2026年阿里云AI产品与云产品优惠权益参考:
AI 产品权益主要包括阿里云百炼 Token Plan,提供多档位套餐,包月预算可控;Qwen3.6全模型通享 4.5 折;阿里云百炼优惠券,先用后返,最高200元,个企同享;阿里云 JVS Claw 39元起,一键接入 OpenClaw等。而云产品权益主要有轻量应用服务器限时抢购2核2G38元/年、2核4G9.9元1个月、199元/年;通用算力型u2i实例3折,九代c9i、g9i、r9i等实例1年付6.4折起等优惠权益。详情可通过阿里云权益中心了解:https://www.aliyun.com/benefit

以上就是阿里云百炼平台的模型训练、模型部署的计费规则及价格介绍。