阿里云百炼大模型服务平台如何部署模型?具体流程与模型计费方式和收费标准参考

在线体验各类最新模型,更有模型 免费Token 额度领取!
立即体验
简介: 本文系统介绍了阿里云百炼平台大模型从调优到部署上线的流程。首先需完成数据准备与模型调优,生成自定义模型并获取API Key;随后在模型部署控制台选择模型与计费方式(后付费/预付费),配置推理模式、上下文长度等参数,等待服务状态变为"运行中"即部署成功。平台提供预置吞吐、模型单元、Token用量三种计费模式,分别适用于高并发生产场景、资源隔离需求及效果验证场景,支持按量与包月付费。部署后可通过OpenAI兼容API、Dify、Chatbox等多种方式调用,也可借助Gradio搭建本地Web UI,满足多样化应用需求。

在大模型技术加速落地的当下,如何高效地将模型从训练推向生产环境,已成为开发者和企业关注的核心议题。阿里云百炼作为一站式大模型开发与服务平台,提供了从模型调优、部署上线到 API 调用的完整链路,极大降低了应用的落地门槛。本文围绕阿里云百炼平台,系统梳理从模型调优生成自定义模型、开通服务获取 API Key,到模型部署全流程及多种计费模式的选择策略,以供参考。

百炼平台模型部署.png

一、部署前的准备工作

1.模型调优生成自定义模型

  • 数据准备:收集并清洗训练数据,按问答对格式整理为训练集,同时准备评测集(未参与训练的新数据)。
  • 训练配置:在“模型调优”页面选择基础模型(如千问系列),配置超参数(如学习率、迭代次数),并选择是否混合预置通用数据。
  • 启动训练:提交训练任务,等待完成后获得待部署的自定义模型(状态为“训练成功”)。

2.开通服务并获取API Key

  • 使用阿里云主账号登录百炼控制台,签署服务协议自动开通服务。
  • 在“API-KEY”管理页面创建API Key,用于后续调用模型服务。

二、模型部署流程

通过阿里云百炼大模型服务平台:https://www.aliyun.com/product/bailian 登录阿里云百炼控制台,导航至“模型部署”页面,点击“部署新模型”。

阿里云百炼产品.png

您可以在控制台上部署模型,请参考以下操作步骤:

1.前往模型部署控制台(北京)。

p1059807.png

2.选择模型、计费方式,其他设置保持默认,最后设置模型名称并开始部署。

  • 模型选择:从已训练成功的自定义模型列表中选择目标模型。
  • 计费方式:
    • 后付费:按实际使用时长计费,适合短期或波动需求,可动态扩缩容。
    • 预付费:包月资源,成本更低但需提前规划资源。
  • 资源配置:根据并发需求选择实例规格(如GPU类型、数量)。

需先完成模型调优,方可部署大部分模型。

3.部署状态为运行中时,代表该模型已部署成功。 重要 模型部署成功后将产生费用。

p1059808.png

4.启动部署任务

  • 确认配置后提交部署请求,系统自动分配资源并部署模型。部署时间通常为30分钟至数小时,受队列等待影响。

5.监控部署状态

  • 部署过程中可通过“模型部署”页面查看进度。成功后模型状态变为“运行中”,并生成唯一模型Code(如qwen3-8b-ft-xxx)用于API调用。

6.部署配置

配置内容 配置详情
配置模型推理模式 部分模型在以模型单元方式部署时,可配置推理模式、最长上下文等。 - Instruct - 模型部署后以非思考模式进行推理。 - Thinking - 模型部署后以思考模式进行推理。
最长上下文 部分模型的模型单元部署模式支持该设置。最长上下文长度基于模型类型。
服务限流 部分模型的模型单元部署模式支持该设置,可限制模型调用的 RPM、TPM。

三、计费方式

部署前可以在模型部署控制台(北京)查看不同模型的预估每小时费用。

说明:计费方式在服务创建后无法更改。如需切换,必须下线已经部署的模型后再重新部署。

预置吞吐 (高吞吐;高性能) 模型单元 (自定义性能指标;资源隔离) Token 用量 (调优后按量计费/效果验证)
定义 通过平台预留资源,保障特定TPM 吞吐能力的模型部署方式;在保障额度内不限速。 按使用时长与模型单元数量配置算力,资源独占的模型部署方式。 以每次调用产生的输入 Token 与输出 Token 作为用量计量依据的模型部署方式。
优势 1. 为高负载生产环境提供稳定的吞吐容量、更低的延迟和更强的资源确定性。 2. 相比按Token用量计费,TPS(每秒生成的 Token 数)通常提升约 1.5~2.0 倍。 3. 支持设置自动续费。 1. 延迟/吞吐等性能指标可自定义。 2. 支持设置自动续费。 3. 支持 PD 分离计算模式。 不使用不计费。
支持模型 部分预置模型 部分预置模型与所有调优后模型 部分经过 LoRA 调优后的模型
使用场景 1. 银行App的智能客服(流量稳定,需保障并发体验)。 2. 社交平台的实时内容审核(需稳定处理可预估的流水线任务)。 3. 公有云翻译API(为标准套餐用户提供基线服务保障)。 1. 电商专属微调大模型(部署私有模型,大促时手动扩容)。 2. 医药公司的分子筛选模型(需独占资源跑长时任务)。 3. 自动驾驶仿真(需要进行长时间持续计算)。 调优后模型效果验证
计费方式 按使用时长和预置吞吐 随用随付、包天 按使用时长和模型单元数量 随用随付、包月 按模型 Token 使用量 随用随付
扩缩容方式 自助增减吞吐量 自助增减模型单元数量 在控制台提交申请,等待人工审核。
产品约束 1. 预付费按天计费。无法提前退费 2. 如果单位时间内使用超出购买的吞吐量,将自动切换成百炼提供的模型调用服务。 预付费购买后,若在首月内提前退订,日单价(≈ 月单价 / 30)将按 1.2 倍计费 1. 只支持部分高效微调(LoRA)后的模型。 2. 一个月内不使用将自动释放。

四、计费详情

1. 按使用时长计费(预置吞吐)

费用 = 使用时长 × (输入 TPM 单价 × 输入 TPM + 输出 TPM 单价 × 输出 TPM)
后付费按小时计算:使用时长单位为小时,单价取下表"持续 1 小时"列;预付费按天计算:使用时长单位为天,单价取下表"持续 1 天"列。

  • 预付费订单支付后实时生效,有效期 N 天至第 N 天 23:59 结束。若在 22:00 后下单,到期日将自动顺延1天。
  • 预付费订单到期后,将延后2小时停止服务,停止后资源保留14小时后释放。
  • 预付费订单无法提前终止服务。
  • 后付费时,如果账户欠费,部署的资源将保留并继续计费 24 小时,之后自动释放资源。

当模型输入超过最长输入 Token 或 超出购买的 TPM 量时,相关调用将自动切换为当前模型的按量付费模式。此时,推理性能可能下降,限流将受业务空间中当前快照模型的公共流量的管控,费用按模型调用(按量付费)标准计收。

  • 此时,调用 API 返回 Header 将包含:x-dashscope-ptu-overflow:true
  • TPM 统计请前往:模型监控(北京)

1、千问

模型名称 模型代码 最长输入Token 后付费输入 Per 10K TPM 后付费输出 Per 1K TPM 预付费输入 Per 10K TPM 预付费输出 Per 1K TPM
千问3.6-Flash-2026-04-16 qwen3.6-flash-2026-04-16 128,000 ¥2.88 ¥1.73 ¥34.56 ¥20.74
千问3.6-Plus-2026-04-02 qwen3.6-plus-2026-04-02 128,000 ¥4.8 ¥2.88 ¥57.6 ¥34.56
千问3.5-Plus-2026-04-20 qwen3.5-plus-2026-04-20 128,000 ¥1.92 ¥1.15 ¥23.04 ¥13.82
千问3-Max-2025-09-23 qwen3-max-2025-09-23 128,000 ¥7.68 ¥3.08 ¥92.16 ¥36.96
千问-Flash-2025-07-28 qwen-flash-2025-07-28 128,000 ¥0.36 ¥0.36 ¥4.32 ¥4.32
千问-Plus-2025-12-01 qwen-plus-2025-12-01 128,000 ¥1.92 非思考:¥0.48 思考:¥1.92 ¥23.04 非思考:¥5.76 思考:¥23.04

2、DeepSeek

模型名称 模型代码 最长输入Token 后付费输入 Per 10K TPM 后付费输出 Per 1K TPM 预付费输入 Per 10K TPM 预付费输出 Per 1K TPM
DeepSeek-v4-Pro deepseek-v4-pro 64,000 ¥43.2 ¥8.64 ¥518.4 ¥103.68
DeepSeek-v3.2 deepseek-v3.2 64,000 ¥7.2 ¥1.08 ¥86.4 ¥12.96
DeepSeek-v3 deepseek-v3 64,000 ¥7.2 ¥2.88 ¥86.4 ¥34.56

3、千问VL

模型名称 模型代码 最长输入Token 后付费输入 Per 10K TPM 后付费输出 Per 1K TPM 预付费输入 Per 10K TPM 预付费输出 Per 1K TPM
千问3-VL-Plus-2025-09-23 qwen3-vl-plus-2025-09-23 128,000 ¥2.4 ¥2.4 ¥28.8 ¥28.8

4、更多模型

模型名称 模型代码 最长输入Token 后付费输入 Per 10K TPM 后付费输出 Per 1K TPM 预付费输入 Per 10K TPM 预付费输出 Per 1K TPM
GLM-5.1 glm-5.1 64,000 ¥21.6 ¥8.64 ¥259.2 ¥103.68

2. 按使用时长计费(模型单元)

费用 = 使用时长(小时)× 模型单元数量 × 模型单元单价
"模型单元单价"在后付费场景下取下表"小时单价"列;预付费按月计费时,公式改为 包月数 × 模型单元数量 × 月单价。

  • 预付费购买的首月,如在首月内提前退订,日单价(≈ 月单价 / 30)将按 1.2 倍计费(不满一天按一天计费)

说明:模型单元-后付费方式的算力资源先买到先得。如购买不成功会全额退款。

1、文本生成(千问)

模型名称 模型代码 模型单元规格 小时单价(元) 月单价(元)
千问3.6-35B-A3B qwen3.6-35b-a3b MU8 ¥47 ¥22,400
千问3.6-35B-A3B qwen3.6-35b-a3b MU9 ¥51 ¥24,600
千问3.6-27B qwen3.6-27b MU9 ¥51 ¥24,600
千问3.6-Flash-2026-04-16 qwen3.6-flash-2026-04-16 MU1 ¥54 ¥26,118
千问3.6-Plus-2026-04-02 qwen3.6-plus-2026-04-02 MU1 ¥54 PD分离模式:¥864 ¥26,118 PD分离模式:¥417,888
千问3.5-397B-A17B qwen3.5-397b-a17b MU3 ¥137 PD分离模式:¥2,192 ¥65,969 PD分离模式:¥1,055,504
千问3.5-397B-A17B qwen3.5-397b-a17b MU6 ¥25 ¥12,089
千问3.5-122B-A10B qwen3.5-122b-a10b MU1 ¥54 ¥26,118
千问3.5-122B-A10B qwen3.5-122b-a10b MU2 ¥63 ¥30,036
千问3.5-122B-A10B qwen3.5-122b-a10b MU6 ¥25 ¥12,089
千问3.5-122B-A10B qwen3.5-122b-a10b MU9 ¥51 ¥24,600
千问3.5-35B-A3B qwen3.5-35b-a3b MU1 ¥54 ¥26,118
千问3.5-35B-A3B qwen3.5-35b-a3b MU2 ¥63 ¥30,036
千问3.5-35B-A3B qwen3.5-35b-a3b MU8 ¥47 ¥22,400
千问3.5-35B-A3B qwen3.5-35b-a3b MU9 ¥51 ¥24,600
千问3.5-27B qwen3.5-27b MU1 ¥54 ¥26,118
千问3.5-27B qwen3.5-27b MU9 ¥51 ¥24,600
千问3.5-9B qwen3.5-9b MU1 ¥54 ¥26,118
千问3.5-9B qwen3.5-9b MU8 ¥47 ¥22,400
千问3.5-9B qwen3.5-9b MU9 ¥51 ¥24,600
千问3.5-Flash-2026-02-23 qwen3.5-flash-2026-02-23 MU1 ¥54 ¥26,118
千问3.5-Flash-2026-02-23 qwen3.5-flash-2026-02-23 MU2 ¥63 ¥30,036
千问3.5-Plus-2026-02-15 qwen3.5-plus-2026-02-15 MU1 ¥54 PD分离模式:¥864 ¥26,118 PD分离模式:¥417,888
千问3.5-Plus-2026-02-15 qwen3.5-plus-2026-02-15 MU3 ¥137 PD分离模式:¥2,192 ¥65,969 PD分离模式:¥1,055,504
千问3-235B-A22B-Instruct-2507 qwen3-235b-a22b-instruct-2507 MU1 ¥54 ¥26,118
千问3-235B-A22B-Instruct-2507 qwen3-235b-a22b-instruct-2507 MU2 ¥63 ¥30,036
千问3-Next-80B-A3B-Instruct qwen3-next-80b-a3b-instruct MU1 ¥54 ¥26,118
千问3-32B qwen3-32b MU1 ¥54 ¥26,118
千问3-32B qwen3-32b MU6 ¥25 ¥12,089
千问3-30B-A3B qwen3-30b-a3b MU9 ¥51 ¥24,600
千问3-30B-A3B-Instruct-2507 qwen3-30b-a3b-instruct-2507 MU1 ¥54 ¥26,118
千问3-30B-A3B-Instruct-2507 qwen3-30b-a3b-instruct-2507 MU2 ¥63 ¥30,036
千问3-8B qwen3-8b MU1 ¥54 ¥26,118
千问3-8B qwen3-8b MU2 ¥63 ¥30,036
千问3-8B qwen3-8b MU5 ¥21 ¥10,139
千问3-4B qwen3-4b MU1 ¥54 ¥26,118
千问3-4B qwen3-4b MU5 ¥21 ¥10,139
千问3-1.7B qwen3-1.7b MU1 ¥54 ¥26,118
千问3-1.7B qwen3-1.7b MU5 ¥21 ¥10,139
千问3-Embedding-0.6B qwen3-embedding-0.6b MU5 ¥21 ¥10,139
千问3-Embedding-0.6B qwen3-embedding-0.6b MU6 ¥25 ¥12,089
千问3-MoE-Rerank-0.6B qwen3-moe-rerank-0.6b MU5 ¥21 ¥10,139
千问3-Rerank-0.6B qwen3-rerank-0.6b MU5 ¥21 ¥10,139
千问3-Rerank-0.6B qwen3-rerank-0.6b MU6 ¥25 ¥12,089
千问3-Max-2025-09-23 qwen3-max-2025-09-23 MU2 ¥63 ¥30,036
千问3-Max-2025-09-23 qwen3-max-2025-09-23 MU3 ¥137 ¥65,969
千问3-Rerank qwen3-rerank MU5 ¥21 ¥10,139
千问2.5-开源版-72B qwen2.5-72b-instruct MU1 ¥54 ¥26,118
千问2.5-开源版-32B qwen2.5-32b-instruct MU1 ¥54 ¥26,118
千问2.5-开源版-14B qwen2.5-14b-instruct MU1 ¥54 ¥26,118
千问2.5-开源版-7B qwen2.5-7b-instruct MU1 ¥54 ¥26,118
千问2.5-开源版-7B qwen2.5-7b-instruct MU5 ¥21 ¥10,139
千问2.5-开源版-3B qwen2.5-3b-instruct MU5 ¥21 ¥10,139
千问-Flash-2025-07-28 qwen-flash-2025-07-28 MU1 ¥54 ¥26,118
千问-Plus-2025-07-28 qwen-plus-2025-07-28 MU1 ¥54 PD分离模式:¥864 ¥26,118 PD分离模式:¥417,888
千问-Plus-2025-12-01 qwen-plus-2025-12-01 MU1 ¥54 ¥26,118

2、文本生成(GLM)

模型名称 模型代码 模型单元规格 小时单价(元) 月单价(元)
GLM-5 glm-5 MU3 ¥137 PD分离模式:¥2,192 ¥65,969 PD分离模式:¥1,055,504
GLM-4.7 glm-4.7 MU6 ¥25 PD分离模式:¥800 ¥12,089 PD分离模式:¥386,848

3、文本生成(DeepSeek)

模型名称 模型代码 模型单元规格 小时单价(元) 月单价(元)
DeepSeek-v4-Flash deepseek-v4-flash MU1 ¥54 ¥26,118
DeepSeek-v3.2 deepseek-v3.2 MU2 ¥63 PD分离模式:¥1,008 ¥30,036 PD分离模式:¥480,576

4、更多模型

模型名称 模型代码 模型单元规格 小时单价(元) 月单价(元)
MiniMax-M2.5 MiniMax-M2.5 MU1 ¥54 PD分离模式:¥864 ¥26,118 PD分离模式:¥417,888
Kimi-K2.5 kimi-k2.5 MU2 ¥63 ¥30,036

模型类型:

  • Instruct - 模型部署后以非思考模式进行推理。
  • Thinking - 模型部署后以思考模式进行推理。

模型部署类型:

  • PD 分离模式 - 降低首 Token 延迟、提高吞吐。
    该部署模式部署的模型在进行模型推理时,将首 Token 计算(Prefill)和后续 Token 计算(Decode)两个计算阶段,拆到不同的计算节点执行。

5、多模态(千问)

模型名称 模型代码 模型单元规格 小时单价(元) 月单价(元)
千问3.5-Omni-Flash qwen3.5-omni-flash MU8 ¥47 ¥22,400
千问3.5-Omni-Flash qwen3.5-omni-flash MU9 ¥51 ¥24,600
千问3.5-Omni-Plus qwen3.5-omni-plus MU9 ¥51 ¥24,600
千问3-VL-235B-A22B-Instruct qwen3-vl-235b-a22b-instruct MU1 ¥54 ¥26,118
千问3-VL-235B-A22B-Thinking qwen3-vl-235b-a22b-thinking MU1 ¥54 ¥26,118
千问3-VL-32B-Instruct qwen3-vl-32b-instruct MU2 ¥63 ¥30,036
千问3-VL-8B-Instruct qwen3-vl-8b-instruct MU1 ¥54 ¥26,118
千问3-VL-4B-Instruct qwen3-vl-4b-instruct MU1 ¥54 ¥26,118
千问3-VL-2B-Instruct qwen3-vl-2b-instruct MU5 ¥21 ¥10,139
千问3-VL-Embedding-2B qwen3-vl-embedding-2b MU5 ¥21 ¥10,139
千问3-VL-Flash-2025-10-15 qwen3-vl-flash-2025-10-15 MU1 ¥54 ¥26,118
千问3-VL-Plus-2025-09-23 qwen3-vl-plus-2025-09-23 MU1 ¥54 ¥26,118
千问VL-Max-2025-08-13 qwen-vl-max-2025-08-13 MU6 ¥25 ¥12,089
千问VL-OCR-2025-11-20 qwen-vl-ocr-2025-11-20 MU6 ¥25 ¥12,089

模型类型:

  • Instruct - 模型部署后以非思考模式进行推理。
  • Thinking - 模型部署后以思考模式进行推理。
  • Instruct/Thinking - 可在模型部署时选择是否开启思考模式。

3. 按模型 Token 使用量

费用 = 模型输入 Token 数 × 模型输入单价 + 模型输出 Token 数 × 模型输出单价(最小计费单位:1 token)

  • 仅当对下列基础模型完成 SFT 高效训练并得到自定义模型后,才支持按模型 Token 使用量计费。

1、千问

基础模型 模型代码 输入 元/千Token 输出 元/千Token
千问3-32B qwen3-32b ¥0.002 非思考模式:¥0.008 思考模式:¥0.02
千问3-14B qwen3-14b ¥0.001 非思考模式:¥0.004 思考模式:¥0.01
千问3-8B qwen3-8b ¥0.0005 非思考模式:¥0.002 思考模式:¥0.005
千问2.5-开源版-72B qwen2.5-72b-instruct ¥0.004 ¥0.012
千问2.5-开源版-32B qwen2.5-32b-instruct ¥0.002 ¥0.006
千问2.5-开源版-14B qwen2.5-14b-instruct ¥0.001 ¥0.003
千问2.5-开源版-7B qwen2.5-7b-instruct ¥0.0005 ¥0.001

2、千问VL

基础模型 模型代码 输入 元/千Token 输出 元/千Token
千问3-VL-8B-Instruct qwen3-vl-8b-instruct ¥0.0005 ¥0.002
千问2.5-VL-72B qwen2.5-vl-72b-instruct ¥0.016 ¥0.048
千问2.5-VL-32B qwen2.5-vl-32b-instruct ¥0.008 ¥0.024
千问2.5-VL-7B qwen2.5-vl-7b-instruct ¥0.002 ¥0.005

4. 图片、视频生成模型(预置)-按实例时长计费

费用 = 资源占用时长(小时)× 实例数量 × 实例单价(不满 1 小时按 1 小时计费)
"实例单价"在后付费场景下取下表"后付费单价(元/实例/小时)"列;预付费按月计费时,公式改为 包月数 × 实例数量 × 预付费单价(元/月)。

1、图片生成

模型服务 模型类型 独占实例资源规格 后付费单价(元/实例/小时) 预付费单价 (元/月)
万相-文本生成图像-0521 预置模型 轻量版 ¥20/实例/小时 ¥10,000/月

2、视频生成

模型服务 模型类型 独占实例资源规格 后付费单价(元/实例/小时) 预付费单价 (元/月)
悦动人像EMO-detect
悦动人像EMO
舞动人像AnimateAnyone-detect
舞动人像AnimateAnyone
预置模型 轻量版 ¥20/实例/小时 ¥10,000/月

五、部署后的验证与管理

1.验证模型有效性

  • 在“模型体验”页面使用测试用例验证模型表现,或通过API调用测试(需替换模型Code为部署后的唯一标识)。
  • 使用“模型评测”功能,基于评测集数据评估模型在特定场景下的准确率与泛化能力。

2.资源管理与优化

  • 扩缩容:根据业务负载调整实例数量,平衡成本与性能。
  • 下线模型:在“模型部署”页面选择“下线”终止服务,避免持续计费。

3.部署后调用

模型部署成功后,支持通过 OpenAI 兼容、Dashscope及Assistant SDK进行调用。
在调用已部署成功的模型时,model的取值应为模型部署成功后的模型code。请前往模型部署控制台(北京)界面获取模型code。

p1051901.png

示例代码以调用微调后的 qwen3-8b 模型为例:

1、DashScope

import os
import dashscope

messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "你是谁?"},
]
response = dashscope.Generation.call(
    # 若没有配置环境变量,请用百炼API Key将下一行替换为:api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    model="qwen3-14b-xxx-xxx",  # 请替换为模型部署成功后的code
    messages=messages,
    result_format="message",
    enable_thinking=False,
)
print(response)

2、OpenAI兼容接口

import os
from openai import OpenAI


client = OpenAI(
    # 若没有配置环境变量,请用百炼API Key将下一行替换为:api_key="sk-xxx",
    api_key=os.getenv('DASHSCOPE_API_KEY'),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen3-14b-xxx-xxx",  # 请替换为模型部署成功后的code
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "你是谁?"},
    ],
    extra_body={"enable_thinking": False},
)
print(completion)

六、关键注意事项

1.计费与成本控制

  • 部署实例按小时或包月计费,需提前规划资源使用时长。
  • 免费额度:新用户享有100万Token或特定免费额度(仅限北京地域),需在有效期内合理使用。 详情可通过阿里云AI产品免费试用活动了解:https://free.aliyun.com/product/ai

AI产品免费试用活动最新.png

2.地域与合规性

  • 选择就近地域(如华北2-北京)降低网络延迟,敏感数据需选择符合合规要求的服务部署范围。

3.API Key安全管理

  • 删除闲置API Key或限制权限,避免未授权调用。

4.混合训练与数据隔离

  • 建议混合部分预置通用数据(比例可调),避免模型完全遗忘基础能力。

七、常见问题

1.可以上传和部署自己的模型吗?
支持在我的模型控制台(北京)导入部分开源模型,详细支持列表请参考:模型导入

此外,阿里云人工智能平台 PAI 提供了部署自有模型的功能,您可以参考PAI-LLM大语言模型部署了解部署方法。

2.部署时提示权限不足怎么办?

  1. 如果显示“缺少该模块的权限”,请确保您的账号在该业务空间的权限管理页面中拥有模型部署-操作权限。

p1030122.png

如果无法正常操作,请联系您的组织或 IT 管理员添加相关权限或代为检查权限问题。

  1. 如果部署时报错“xx业务空间没有部署xx模型的权限”,请前往百炼的业务空间管理页面,为对应业务空间添加对应模型的部署权限。

    API 调用报错:Workspace xxx does not have deployment privilege for model xxxx

p1030115.png

p1030118.png

如果提示权限不足,请联系您的组织或 IT 管理员添加相关权限或代为操作。

3.该如何切换到其他的计费方式?
只能释放原有资源,再通过需要的计费方式创建新资源。
建议按照以下步骤进行切换:

  1. 使用需要的计费方式部署新的资源。
  2. 切换 API 并测试服务可用性。
  3. 下线释放原有资源。

附:2026年阿里云AI产品与云产品优惠权益参考
AI 产品权益主要包括阿里云百炼 Token Plan,提供多档位套餐,包月预算可控;HappyHorse-1.0 系列模型 限时 8 折;阿里云百炼 Token Plan,提供多档位套餐,包月预算可控;Qwen3.6全模型通享 4.5 折;Qwen3.7-Max 发布 限时 5 折;阿里云百炼优惠券,先用后返,最高200元,个企同享;阿里云 JVS Claw 39元起,一键接入 OpenClaw等。而云产品权益主要有轻量应用服务器限时抢购2核2G38元/年、2核4G9.9元1个月、199元/年;通用算力型u2i实例3折,九代c9i、g9i、r9i等实例1年付6.4折起等优惠权益。详情可通过阿里云权益中心了解:https://www.aliyun.com/benefit

AI产品权益2026.png

小结:通过以上流程,企业可高效完成模型从训练到部署的全流程管理,结合阿里云百炼的弹性资源与安全机制,实现模型能力的快速落地与迭代。

相关文章
|
22天前
|
人工智能 自然语言处理 API
阿里云百炼大模型服务平台主要模型介绍:文本生成、图像与视频、音频与语音等热门模型与能力简介
阿里云百炼是阿里云推出的一站式大模型开发与应用平台,集成千问(Qwen)全系列及DeepSeek、Kimi、GLM、MiniMax等主流第三方大模型,覆盖文本、图像、音频、视频、向量等多模态能力。开发者可通过OpenAI兼容API直接调用模型,业务人员则可借助可视化工具快速搭建智能体、知识库问答等AI应用,无需自行部署运维。新用户注册开通即可获赠超7000万tokens免费额度,支持从模型体验到应用落地的流程服务,显著降低AI应用开发门槛。
|
22天前
|
人工智能 运维 监控
阿里云百炼大模型平台是什么解析:核心功能、价格体系与配置指南
阿里云百炼大模型平台(Model Studio)是阿里云打造的一站式大模型开发与应用服务平台,面向开发者、企业与业务人员提供全链路AI能力支持。它集成通义千问全系模型与主流第三方大模型,兼容OpenAI API标准,兼顾低代码可视化操作与高代码深度开发,覆盖模型调用、微调训练、知识库构建、智能体开发、应用部署与运维全流程,是企业与个人快速落地AI应用、降低大模型使用门槛的核心工具。
552 2
|
2月前
|
人工智能 自然语言处理 API
阿里云百炼Token Plan团队版产品与收费标准介绍:标准版198元、高级版698元,尊享版1398元
阿里云百炼Token Plan团队版是面向企业和开发者的多模态AI大模型订阅服务,以Credits为统一计量单位,支持文本生成与图像生成模型灵活切换,兼容主流AI编程与智能体工具。提供标准、高级、尊享三档包月套餐,多租户隔离确保高峰不排队,并承诺不使用对话数据训练模型,保障数据安全。超出套餐额度可购买共享用量包,消费可通过控制台和费用中心实时监控。适用于AI编程集成、智能体开发等场景。配合Qwen3.6发布低至4.5折优惠及先用后返最高200元活动,可助力用户灵活控制AI预算。
|
人工智能 安全 Apache
QwenPaw:你的私人 AI 助理 —— 数据归你、记忆进化、多端触达的开源个人智能体
QwenPaw 是一款开源、本地优先的AI个人智能体(Apache 2.0),数据归属用户、记忆自主进化、支持钉钉/飞书/微信等多端触达。3行命令即可部署,内置Coding IDE、Persona人格、定时任务、MCP工具生态与多Agent协作,真正属于你的私有AI助理。
QwenPaw:你的私人 AI 助理 —— 数据归你、记忆进化、多端触达的开源个人智能体
|
2月前
|
人工智能 自然语言处理 监控
阿里云大模型服务平台怎么用?模型训练、模型部署计费规则及价格参考
本文介绍了阿里云百炼平台模型训练与模型部署两大环节的计费规则。训练方面,千问系列文本模型按Token计费,价格从0.003元/千Token至0.15元/千Token不等;万相视频生成模型则按训练Token总量计费,需结合视频时长、像素和循环次数计算。部署方面,提供按使用时长(预置吞吐/模型单元)、按Token使用量及按实例时长等多种计费方式,覆盖千问、千问VL、万相等主流模型。文章还附有计费示例与常见问题解答,帮助用户合理规划AI应用成本。
|
22天前
|
人工智能 缓存 自然语言处理
阿里云Token Plan(团队版)模型订阅计划介绍:产品功能、支持模型与开通和部署教程参考
Token Plan 团队版是阿里云百炼面向企业推出的大模型订阅服务,以 Credits 统一计量,覆盖千问、DeepSeek、Kimi 等十余款主流模型,支持文本与图像生成。它提供标准、高级、尊享三档坐席套餐(198-1398元/月),配套团队管理后台,可实现成员管理、席位分配、用量监控与预算控制。该服务兼容 Claude Code、Qwen Code、OpenCode 等主流 AI 工具链,数据不用于模型训练,满足企业隐私合规需求。
|
22天前
|
存储 安全 Java
首个 Java Harness Framework 来了 -- AgentScope 1.1 HarnessAgent 详解
AgentScope Java 1.1.0正式发布,完整实现Harness Framework:支持工作区驱动、可插拔抽象文件系统、开箱即用上下文管理与子Agent编排,兼顾个人提效与企业级安全、隔离、分布式部署需求。
|
22天前
|
人工智能 安全 5G
阿里企业邮箱多少钱一年?2026最新价格免费版、标准版、AI尊享版和国产化版收费标准
阿里企业邮箱2026年最新报价:免费版(0元/年,限50账号)、标准版540元/年、AI尊享版720元/年、国产化版810元/年。各版本网盘容量、账号数及AI功能差异显著,支持智能写信、翻译、摘要等,满足不同企业需求。阿里云企业邮箱官网链接:https://t.aliyun.com/U/gNeTEB
326 0
|
2月前
|
人工智能 自然语言处理 API
阿里云百炼Token Plan订阅方案:支持多模型灵活切换,兼容主流AI工具,多档位套餐,包月预算可控
阿里云百炼Token Plan团队版是面向企业及开发者的多模态AI订阅服务,采用Credits统一计量,支持Qwen3.6、Wan2.7、GLM-5、DeepSeek-V4、Kimi K2.6等十余款主流模型,兼容Qwen Code、Claude Code、OpenClaw等热门AI工具。提供标准版(198/月)、高级版(698/月)、尊享版(1,398/月)三档坐席,配套共享用量包(5,000/62.5万Credits)供弹性补额。计费按Token实际消耗抵扣,无频次限制,承诺不使用用户数据训练模型,多租户隔离保障稳定运行,适用于团队协作、开发办公等场景。
|
5月前
|
存储 弹性计算 固态存储
阿里云服务器按量付费是什么?到底划不划算?
阿里云ECS按量付费是“先用后付、按小时计费”的灵活模式,适合临时扩展、测试、电商抢购等短期或突发场景。开通需账户余额≥100元,不支持备案。相比包年包月更省成本(如仅用几小时),且可随时释放,弹性伸缩便捷。
693 3

热门文章

最新文章