阿里云百炼是什么？模型服务能力与新人免费额度与使用常见问题介绍-阿里云开发者社区

阿里云百炼是一站式大模型开发与应用平台，集成千问及主流第三方模型。面向开发者提供兼容 OpenAI 的API和全链路模型服务；面向业务人员提供可视化应用构建能力，可快速创建智能体、知识库问答等 AI 应用。

阿里云百炼大模型服务平台.png

一、主要能力：

调用 API
几行代码即可调用大模型，实现内容创作、摘要生成等功能。
百炼兼容 OpenAI 接口规范，只需调整API Key、base_url 和模型名称，即可将现有 OpenAI 代码迁移至百炼。

1、Python

import os
from openai import OpenAI

# 注意: 不同地域的base_url不通用（下方示例使用北京地域的 base_url）
# - 华北2（北京）: https://dashscope.aliyuncs.com/compatible-mode/v1
# - 美国（弗吉尼亚）: https://dashscope-us.aliyuncs.com/compatible-mode/v1
# - 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1，请将WorkspaceId替换为业务空间ID
# - 德国（法兰克福）: https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1，请将WorkspaceId替换为业务空间ID
client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[{'role': 'user', 'content': '你是谁？'}]
)
print(completion.choices[0].message.content)


2、Node.js

``` import OpenAI from "openai";

// 注意: 不同地域的base_url不通用（下方示例使用北京地域的base_url）
// - 华北2（北京）: https://dashscope.aliyuncs.com/compatible-mode/v1
// - 美国（弗吉尼亚）: https://dashscope-us.aliyuncs.com/compatible-mode/v1
// - 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1，请将WorkspaceId替换为业务空间ID
// - 德国（法兰克福）: https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1，请将WorkspaceId替换为业务空间ID
const openai = new OpenAI(
    {
        apiKey: process.env.DASHSCOPE_API_KEY,
        baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
    }
);

async function main() {
    const completion = await openai.chat.completions.create({
        model: "qwen3.7-plus",
        messages: [{ role: "user", content: "你是谁？"}],
    });
    console.log(completion.choices[0].message.content)
}

main()

3、curl

不同地域的 Base URL不通用（以下示例是北京地域 Base URL）

华北2（北京）： https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
美国（弗吉尼亚）： https://dashscope-us.aliyuncs.com/compatible-mode/v1/chat/completions
新加坡： https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1/chat/completions，请将WorkspaceId替换为业务空间ID
德国（法兰克福）： https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1/chat/completions，请将WorkspaceId替换为业务空间ID

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你是谁？"
}
]
}'
```

二、模型服务

2.1 开箱即用的模型

百炼提供开箱即用的模型服务，无需自行部署或运维，直接调用自研千问（Qwen）全系列模型，以及 DeepSeek、Kimi、GLM 等第三方大模型。

千问（Qwen）系列旗舰模型：
- 千问 Max：Qwen 系列效果最好的模型，适合处理复杂、多步骤任务。
  
  最新的 qwen3.7-max 推理能力全面超越前代，推荐选用。
- 千问 Plus：效果、速度和成本均衡，是多数场景的推荐选择。
- 千问 Flash：高性价比、低延迟，适合需要快速响应的简单任务。
多模态覆盖：涵盖文本生成、视觉理解、图像生成、视频生成、语音识别与合成、嵌入向量等多种能力。
细分领域模型：提供长文本处理、翻译、数据挖掘、法律、意图理解、角色扮演、深入研究等多种领域模型。

2.2 模型调优、部署和评测

模型调优：支持有监督微调（SFT）、继续预训练（CPT）和直接偏好优化（DPO），满足特定业务需求。
模型部署：将预置模型或调优后的自定义模型部署为资源专享的推理服务，满足高并发、低延迟等性能要求。支持按时长、包月、按 Token 量等多种计费方式。
模型评测：提供人工评测、自动评测和基线评测，支持快速对比不同模型表现，验证调优效果，提前发现潜在调用风险。

三、应用构建

应用类型：提供可视化和高代码两种开发模式。可视化模式可快速创建智能体应用和工作流应用；高代码应用则支持将 Python 项目部署为后端服务，具备自动化运维、可观测、日志服务等能力。
功能拓展：通过知识库（RAG）接入私有数据和专业领域知识；通过插件和模型上下文协议（MCP）调用外部服务。
分享与发布：支持将应用发布至网页、钉钉机器人、微信公众号及音视频互动智能体等多种平台。

四、产品计费

开通百炼无需费用，调用、微调、部署模型时产生相应费用。百炼部分模型实行阶梯计费。单价取决于单次请求的输入 Token 总量。该请求的所有 Token 均按对应阶梯的单价结算。
例如，某模型设有两档计费区间：0 < Token ≤ 32K 和 32K < Token ≤ 128K。若输入 100K Token，因数值落在第二区间（32K < 100K ≤ 128K），所有 Token 均按第二档单价结算。模型调用计费详情可参考：https://help.aliyun.com/zh/model-studio/model-pricing

五、新用户免费额度

百炼为新用户提供北京地域专属的新人免费额度，用于体验模型调用。当您首次开通阿里云百炼时，平台会自动为您发放各模型的新人专属免费额度。
说明：仅华北2（北京）地域且服务部署范围为中国内地的模型享有免费额度，其他地域和部署范围无免费额度。

5.1 规则说明

有效期

免费额度的有效期为 30～90 天，从开通阿里云百炼或模型申请通过之日起计算。额度到期或耗尽后，继续调用模型推理服务将产生计费。

首次开通阿里云百炼的用户，获赠的新人免费额度有效期调整为 90 天，用户可通过阿里云百炼大模型服务平台：https://www.aliyun.com/product/bailian 申请免费额度。系统将自动开通阿里云百炼并发放免费推理额度。

阿里云百炼申请免费tokens.png

如果未弹出服务协议，表示您已经开通过阿里云百炼且获得免费额度。

适用范围

免费额度仅抵扣模型实时推理（调用）产生的费用，不支持抵扣以下场景：

Batch调用
模型调优
模型部署
自定义模型（调优后模型、已部署模型）

注意事项

阿里云主账号与其RAM子账号共享免费额度。

例如：qwen-max的总免费额度为100万Token。主账号消耗了10万Token，RAM子账号消耗了20万Token，qwen-max的剩余免费额度为70万Token。

5.2 查看剩余额度

可通过以下两种方式查看模型的免费额度。

方式一：通过模型用量查看

在控制台的模型用量页面，点击免费额度页签，查看所有模型的免费额度余量及过期时间。

方式二：通过模型广场查看

在控制台的模型广场页面，找到目标模型系列并单击进入详情页。

模型广场图.png

在模型Code选择模型版本，在免费额度区域查看余量。若无免费额度显示，可能额度已到期，具体有效期参见模型列表。

362,917/1,000,000 表示剩余 362,917 个Token，总共 1,000,000 个Token。

控制台显示的免费额度为分钟级更新（需手动刷新页面）。

免费额度区域.png

5.3 使用免费额度

实时调用大模型将自动扣除免费额度，

默认情况下，全新未认证用户免费额度耗尽后无法继续使用，需要认证并充值后方能继续按量付费。已认证用户免费额度耗尽后继续调用会直接扣费，可提前开启免费额度用完即停功能，防止产生意外费用。

全新未认证用户免费额度耗尽后，将停止响应并返回错误码 AllocationQuota.FreeTierOnly，需要认证并充值后方能继续按量付费。

免费额度用完即停

开启此功能后，免费额度耗尽时将停止响应并返回错误码 AllocationQuota.FreeTierOnly，不会继续扣费。

如何开启

方式一：在模型用量页面开启

为单个模型开启：

在控制台的模型用量页面，点击免费额度页签。
在列表中找到目标模型，在其右侧操作列开启免费额度用完即停开关（无免费额度的模型无法开启）。

批量开启：

在控制台的模型用量页面，点击免费额度页签。
点击批量操作免费额度用完即停，在下拉菜单中选择批量开启。
勾选目标模型，点击批量开启。如需为所有支持且未开启的模型启用，可点击一键开启所有模型。
在确认弹窗中点击开启免费额度用完即停。

方式二：在模型广场页面开启

以 Qwen3-Coder-Plus 为例。前往Qwen3-Coder-Plus 模型详情页，开启免费额度用完即停开关。
若模型未显示开关，说明该模型免费额度已耗尽或过期，或模型本身不提供免费额度。

如何关闭

该功能默认关闭。若已启用免费额度用完即停，需等到控制台显示免费额度用完后才可关闭。

控制台显示的免费额度为分钟级更新（需手动刷新页面）。

六、阿里云百炼大模型服务优惠

阿里云AI通用型节省计划是针对大模型按量付费使用场景设计的折扣方案。只需承诺在一定期限内（3 个月、6 个月、12 个月或 24 个月）的月消费金额，即可在保留按量付费灵活性的基础上，享受阶梯式折扣，优化模型调用成本。从档位上来区分可分为A类、B类和C类。更多阿里云大模型服务平台百炼节省计划与资源包官方介绍可参考：https://help.aliyun.com/zh/model-studio/savings-plan-and-resource-package

AI通用型节省计划管理.png

承诺周期说明：以月为单位（从生效日到下个月的对应日），月承诺周期结束时，剩余额度自动过期，不可累积到下一周期。举例：如果一次性订阅了 3 个月的节省计划（月承诺额度 1000 元），并非在 3 个月内获得 3000 元总额度，而是每月独立获得 1000 元额度，当月未使用完的部分自动清零，不可累积到下个订阅月。

抵扣范围：

支持抵扣：模型调用（输入和输出 Tokens）、模型原生工具调用（如 Function Call、联网搜索、网页抓取等）、上下文缓存、批量推理等产生的费用。
不支持抵扣：模型调优、模型部署的费用，以及 MCP 广场和模型体验的联网搜索的费用。

抵扣逻辑：

抵扣顺序：免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
多个同类型的节省计划：优先抵扣先到期的节省计划。若到期时间相同，则优先抵扣先购买的节省计划。
超出部分处理：如果同类节省计划全部到期或额度全部抵扣完后，仍有超出部分，自动转为按量付费。

此外，阿里云还推出了入门型AI通用节省计划，面向新用户提供三档全模型通用抵扣券：全模型通用抵扣20元（新客当月抵扣，直省50%，价格10元/1个月）、全模型通用抵扣100元（新客当月抵扣，直省50%，价格50元/1个月）、全模型通用抵扣500元（新客当月抵扣，直省50%，价格250元/1个月）。详情可通过智启AI普惠权益：https://www.aliyun.com/benefit/ai/discount 等相关活动查阅。

全模型通享低至4.5折.png

七、开始使用阿里云百炼

在线体验大模型：
- 打开阿里云百炼控制台，在右上角选择目标地域
- 进入模型体验页面，选择模型开始体验
发起第一个API请求：首次调用千问API
构建第一个大模型应用：0代码构建问答应用

八、常见问题

Q：我的数据安全吗？阿里云百炼会用我的数据进行训练吗？
A：不会。阿里云严格保护数据隐私，不会将您的数据用于模型训练。构建应用或训练模型时传输的所有数据均经过加密处理。

Q：阿里云百炼提供哪些地域的服务？不同地域有什么区别？
A：目前提供以下地域的模型服务：
华北2（北京）、美国（弗吉尼亚、国际（新加坡）和德国（法兰克福）地域

建议选择邻近地域以降低网络延迟。各地域的接入点（Endpoint/Base URL）不同，API Key 不通用，支持的模型、平台功能与价格也有所差异。

Q：如何避免产生费用？
A：百炼采用按量付费，本身没有"自动扣费"开关。以下措施可有效控制费用：

删除API Key：前往阿里云百炼控制台，选择目标地域，进入API-KEY页面，删除所有API Key，从源头阻断调用。
停止所有调用：停止应用程序、智能体、工作流中的模型调用，并排查定时任务和后台进程。
清理计费资源：删除不再使用的知识库；前往模型部署页面，下线按算力时长计费的部署实例。
开启"免费额度用完即停"（仅限新用户且在免费额度有效期内）：在模型详情页开启此开关，免费额度耗尽后服务自动停止，不会转为付费。仅适用于华北2（北京）地域（中国内地服务部署范围），且须在免费额度有效期内。
设置费用监控和预警：查看账单详情和模型监控，并设置高额消费预警，及时发现异常消费。
订阅 Coding Plan（AI 编码套餐）：固定月费，提供月度请求额度，无按量扣费风险。注意需使用 Coding Plan 专属的 Base URL和API Key 进行调用，否则模型调用将按量付费。

Q：如何使用 Qwen3 系列模型或 DeepSeek？
A：

在线体验：打开阿里云百炼控制台，选择目标地域，进入模型广场页面，点击模型即可体验（DeepSeek 仅支持北京地域）。
通过API调用：请参见首次调用千问API。
通过开发工具（如 Claude Code）调用：
通过可视化界面构建大模型应用：

Q：免费额度即将用完或已用完，是否有通知？
A：有通知。余量降至 20% 或完全耗尽时，系统通过短信、站内信、邮件发送通知。

如需开启或关闭预警、修改预警比例，请前往我的试用进行设置。找到试用规格描述为百炼大模型推理免费试用，单击查看试用详情，再单击右上角配置余量到期预警规则即可修改。

Q：免费额度用完会有什么影响？
A：对于全新未认证用户：免费额度用完后无法继续调用。需要完成认证后方可继续按量付费。

对于已认证用户：

若已开启免费额度用完即停，免费额度用完后无法继续调用，需要关闭免费额度用完即停方可继续按量付费。
若未开启免费额度用完即停，正在进行的调用不会中断，超出额度的Token将按控制台中的输入/输出价格计费，费用以按量后付费方式从阿里云账户扣除，可能导致账户欠费。

账户欠费时，即使其他模型仍有免费额度也无法调用。
调用前建议查询该模型剩余额度，并配置预算管理或账号余额预警，确保账户有充足余额，未使用的余额支持余额提现。

Q：如何查看免费额度消耗记录或账单？
A：调用结束几分钟后即可生成消耗记录。查询步骤：

在账单详情页面，选择账单月份，产品名称选择大模型服务平台百炼，单击搜索。
单击账单列表右上角的查看图标，找到用量信息，勾选抵扣用量，单击确定。
找到费用类型为免费额度的账单项，抵扣用量即为免费额度已抵扣的用量。

Q：为什么产生了费用？
A：常见原因：

使用的模型已经没有免费额度。
免费额度不支持抵扣OpenAI兼容-Batch（文件输入）产生的费用。
控制台的免费额度数据为分钟级更新且需手动刷新。若未及时刷新，页面显示仍有额度但实际已耗尽，导致产生调用费用。操作前刷新页面，以最新显示为准。

Q：如何查看产生费用的模型？
A：调用结束几分钟后，在账单详情页面，选择账单月份，商品名称选择阿里云百炼大模型推理，单击搜索。在资产/资源实例ID 列查看产生费用的模型。

Q：如何查看模型调用记录？
A：模型调用完一小时后，在模型监控北京或新加坡页面设置查询条件（例如，选择时间范围、业务空间等），再在模型列表区域找到目标模型并单击操作列的监控，即可查看该模型的调用统计结果。

数据按小时更新，高峰期可能有小时级延迟，请您耐心等待。

Q：如何避免扣费？
A：超出免费额度后会自动从账号余额扣费。可通过以下方式降低扣费风险：

删除已创建的 API-Key：进入阿里云百炼的API-Key（北京）或者（新加坡）页面，删除已创建的 API-Key。删除后将无法通过API调用模型，不再产生调用费用。
设置高额消费预警：当产品日账单超过预警阈值时，每天短信提醒一次（统计截止昨日24点）。
在预警产品下拉框中选择具体产品（如百炼大模型部署、百炼大模型推理、百炼大模型训练），在预警阈值输入框中填写金额（如0.01），然后单击增加即可添加预警规则。

Q：还有剩余额度，为何调用失败？
A：请检查阿里云账户是否欠费。账户欠费时，即使模型仍有免费额度也无法调用。

A：Q：为什么看不到免费额度与有效期？
免费额度列显示无免费额度或免费额度区域不显示，说明该账号下对应模型的免费额度已到期。

北京地域没有免费额度。

小结：阿里云百炼作为一站式大模型开发与应用平台，凭借兼容OpenAI的API规范、覆盖千问及DeepSeek等150+主流模型的能力，以及灵活的计费机制，极大降低了开发者接入大模型的门槛。无论是通过几行代码快速调用API，还是利用可视化工具零代码构建智能体应用，百炼都能满足不同角色的需求。平台提供的免费额度、按量付费、节省计划及Token订阅等多种计费方式，让用户可以根据自身业务规模灵活控制成本。加上数据不用于模型训练的隐私保障，以及完善的账单监控与预警机制，阿里云百炼为企业和开发者提供了一个安全、高效、可控的AI落地路径，是当前大模型应用开发的优质选择。

阿里云百炼是什么？模型服务能力与新人免费额度与使用常见问题介绍