阿里云百炼是什么?模型服务能力与新人免费额度与使用常见问题介绍

简介: 阿里云百炼是一站式大模型开发与应用平台,集成千问及DeepSeek、Kimi、GLM等主流第三方模型。平台提供兼容OpenAI的API接口,开发者只需调整API Key、base_url和模型名称,即可用几行代码快速迁移现有OpenAI项目,支持Python、Node.js、curl等多种语言调用,并覆盖北京、美国、新加坡、德国等多地域接入。同时,百炼面向业务人员提供可视化应用构建能力,可快速创建智能体、知识库问答等AI应用。模型服务方面,提供千问Max、Plus等开箱即用的模型,无需自行部署运维,满足内容创作、摘要生成等多种场景需求。

阿里云百炼是一站式大模型开发与应用平台,集成千问及主流第三方模型。面向开发者提供兼容 OpenAI 的API和全链路模型服务;面向业务人员提供可视化应用构建能力,可快速创建智能体、知识库问答等 AI 应用。

阿里云百炼大模型服务平台.png

一、主要能力:

调用 API
几行代码即可调用大模型,实现内容创作、摘要生成等功能。
百炼兼容 OpenAI 接口规范,只需调整API Key、base_url 和模型名称,即可将现有 OpenAI 代码迁移至百炼。

1、Python

import os
from openai import OpenAI

# 注意: 不同地域的base_url不通用(下方示例使用北京地域的 base_url)
# - 华北2(北京): https://dashscope.aliyuncs.com/compatible-mode/v1
# - 美国(弗吉尼亚): https://dashscope-us.aliyuncs.com/compatible-mode/v1
# - 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
# - 德国(法兰克福): https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[{'role': 'user', 'content': '你是谁?'}]
)
print(completion.choices[0].message.content)


2、Node.js

``` import OpenAI from "openai";

// 注意: 不同地域的base_url不通用(下方示例使用北京地域的base_url)
// - 华北2(北京): https://dashscope.aliyuncs.com/compatible-mode/v1
// - 美国(弗吉尼亚): https://dashscope-us.aliyuncs.com/compatible-mode/v1
// - 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
// - 德国(法兰克福): https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1,请将WorkspaceId替换为业务空间ID
const openai = new OpenAI(
    {
        apiKey: process.env.DASHSCOPE_API_KEY,
        baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
    }
);

async function main() {
    const completion = await openai.chat.completions.create({
        model: "qwen3.7-plus",
        messages: [{ role: "user", content: "你是谁?"}],
    });
    console.log(completion.choices[0].message.content)
}

main()

3、curl

不同地域的 Base URL不通用(以下示例是北京地域 Base URL)

  • 华北2(北京): https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
  • 美国(弗吉尼亚): https://dashscope-us.aliyuncs.com/compatible-mode/v1/chat/completions
  • 新加坡: https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1/chat/completions,请将WorkspaceId替换为业务空间ID
  • 德国(法兰克福): https://{WorkspaceId}.eu-central-1.maas.aliyuncs.com/compatible-mode/v1/chat/completions,请将WorkspaceId替换为业务空间ID

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "你是谁?"
}
]
}'
```

二、模型服务

2.1 开箱即用的模型

百炼提供开箱即用的模型服务,无需自行部署或运维,直接调用自研千问(Qwen)全系列模型,以及 DeepSeek、Kimi、GLM 等第三方大模型。

  • 千问(Qwen)系列旗舰模型:
    • 千问 Max:Qwen 系列效果最好的模型,适合处理复杂、多步骤任务。

      最新的 qwen3.7-max 推理能力全面超越前代,推荐选用。

    • 千问 Plus:效果、速度和成本均衡,是多数场景的推荐选择。
    • 千问 Flash:高性价比、低延迟,适合需要快速响应的简单任务。
  • 多模态覆盖:涵盖文本生成、视觉理解、图像生成、视频生成、语音识别与合成、嵌入向量等多种能力。
  • 细分领域模型:提供长文本处理、翻译、数据挖掘、法律、意图理解、角色扮演、深入研究等多种领域模型。

2.2 模型调优、部署和评测

  • 模型调优:支持有监督微调(SFT)、继续预训练(CPT)和直接偏好优化(DPO),满足特定业务需求。
  • 模型部署:将预置模型或调优后的自定义模型部署为资源专享的推理服务,满足高并发、低延迟等性能要求。支持按时长、包月、按 Token 量等多种计费方式。
  • 模型评测:提供人工评测、自动评测和基线评测,支持快速对比不同模型表现,验证调优效果,提前发现潜在调用风险。

三、应用构建

  • 应用类型:提供可视化和高代码两种开发模式。可视化模式可快速创建智能体应用和工作流应用;高代码应用则支持将 Python 项目部署为后端服务,具备自动化运维、可观测、日志服务等能力。
  • 功能拓展:通过知识库(RAG)接入私有数据和专业领域知识;通过插件和模型上下文协议(MCP)调用外部服务。
  • 分享与发布:支持将应用发布至网页、钉钉机器人、微信公众号及音视频互动智能体等多种平台。

四、产品计费

开通百炼无需费用,调用、微调、部署模型时产生相应费用。百炼部分模型实行阶梯计费。单价取决于单次请求的输入 Token 总量。该请求的所有 Token 均按对应阶梯的单价结算。
例如,某模型设有两档计费区间:0 < Token ≤ 32K 和 32K < Token ≤ 128K。若输入 100K Token,因数值落在第二区间(32K < 100K ≤ 128K),所有 Token 均按第二档单价结算。模型调用计费详情可参考:https://help.aliyun.com/zh/model-studio/model-pricing

五、新用户免费额度

百炼为新用户提供北京地域专属的新人免费额度,用于体验模型调用。当您首次开通阿里云百炼时,平台会自动为您发放各模型的新人专属免费额度。
说明:仅华北2(北京)地域且服务部署范围为中国内地的模型享有免费额度,其他地域和部署范围无免费额度。

5.1 规则说明

有效期

免费额度的有效期为 30~90 天,从开通阿里云百炼或模型申请通过之日起计算。额度到期或耗尽后,继续调用模型推理服务将产生计费。

首次开通阿里云百炼的用户,获赠的新人免费额度有效期调整为 90 天,用户可通过阿里云百炼大模型服务平台:https://www.aliyun.com/product/bailian 申请免费额度。系统将自动开通阿里云百炼并发放免费推理额度。

阿里云百炼申请免费tokens.png

如果未弹出服务协议,表示您已经开通过阿里云百炼且获得免费额度。

适用范围

免费额度仅抵扣模型实时推理(调用)产生的费用,不支持抵扣以下场景:

  • Batch调用
  • 模型调优
  • 模型部署
  • 自定义模型(调优后模型、已部署模型)

注意事项

阿里云主账号与其RAM子账号共享免费额度。

例如:qwen-max的总免费额度为100万Token。主账号消耗了10万Token,RAM子账号消耗了20万Token,qwen-max的剩余免费额度为70万Token。

5.2 查看剩余额度

可通过以下两种方式查看模型的免费额度。

方式一:通过模型用量查看

在控制台的模型用量页面,点击免费额度页签,查看所有模型的免费额度余量及过期时间。

方式二:通过模型广场查看
  1. 在控制台的模型广场页面,找到目标模型系列并单击进入详情页。

模型广场图.png

  1. 在模型Code选择模型版本,在免费额度区域查看余量。若无免费额度显示,可能额度已到期,具体有效期参见模型列表。

    362,917/1,000,000 表示剩余 362,917 个Token,总共 1,000,000 个Token。

    控制台显示的免费额度为分钟级更新(需手动刷新页面)。

免费额度区域.png

5.3 使用免费额度

实时调用大模型将自动扣除免费额度,

默认情况下,全新未认证用户免费额度耗尽后无法继续使用,需要认证并充值后方能继续按量付费。已认证用户免费额度耗尽后继续调用会直接扣费,可提前开启免费额度用完即停功能,防止产生意外费用。

全新未认证用户免费额度耗尽后,将停止响应并返回错误码 AllocationQuota.FreeTierOnly,需要认证并充值后方能继续按量付费。

免费额度用完即停

开启此功能后,免费额度耗尽时将停止响应并返回错误码 AllocationQuota.FreeTierOnly,不会继续扣费。

如何开启
方式一:在模型用量页面开启

为单个模型开启:

  1. 在控制台的模型用量页面,点击免费额度页签。
  2. 在列表中找到目标模型,在其右侧操作列开启免费额度用完即停开关(无免费额度的模型无法开启)。

批量开启:

  1. 在控制台的模型用量页面,点击免费额度页签。
  2. 点击批量操作免费额度用完即停,在下拉菜单中选择批量开启。
  3. 勾选目标模型,点击批量开启。如需为所有支持且未开启的模型启用,可点击一键开启所有模型。
  4. 在确认弹窗中点击开启免费额度用完即停。
方式二:在模型广场页面开启

以 Qwen3-Coder-Plus 为例。前往Qwen3-Coder-Plus 模型详情页,开启免费额度用完即停开关。
若模型未显示开关,说明该模型免费额度已耗尽或过期,或模型本身不提供免费额度。

如何关闭

该功能默认关闭。若已启用免费额度用完即停,需等到控制台显示免费额度用完后才可关闭。

控制台显示的免费额度为分钟级更新(需手动刷新页面)。

六、阿里云百炼大模型服务优惠

阿里云AI通用型节省计划是针对大模型按量付费使用场景设计的折扣方案。只需承诺在一定期限内(3 个月、6 个月、12 个月或 24 个月)的月消费金额,即可在保留按量付费灵活性的基础上,享受阶梯式折扣,优化模型调用成本。从档位上来区分可分为A类、B类和C类。更多阿里云大模型服务平台百炼节省计划与资源包官方介绍可参考:https://help.aliyun.com/zh/model-studio/savings-plan-and-resource-package

AI通用型节省计划管理.png

承诺周期说明:以月为单位(从生效日到下个月的对应日),月承诺周期结束时,剩余额度自动过期,不可累积到下一周期。举例:如果一次性订阅了 3 个月的节省计划(月承诺额度 1000 元),并非在 3 个月内获得 3000 元总额度,而是每月独立获得 1000 元额度,当月未使用完的部分自动清零,不可累积到下个订阅月。

抵扣范围

  • 支持抵扣:模型调用(输入和输出 Tokens)、模型原生工具调用(如 Function Call、联网搜索、网页抓取等)、上下文缓存、批量推理等产生的费用。
  • 不支持抵扣:模型调优、模型部署的费用,以及 MCP 广场和模型体验的联网搜索的费用。

抵扣逻辑

  • 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。
  • 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
  • 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。

此外,阿里云还推出了入门型AI通用节省计划,面向新用户提供三档全模型通用抵扣券:全模型通用抵扣20元(新客当月抵扣,直省50%,价格10元/1个月)、全模型通用抵扣100元(新客当月抵扣,直省50%,价格50元/1个月)、全模型通用抵扣500元(新客当月抵扣,直省50%,价格250元/1个月)。详情可通过智启AI普惠权益:https://www.aliyun.com/benefit/ai/discount 等相关活动查阅。

全模型通享低至4.5折.png

七、开始使用阿里云百炼

  • 在线体验大模型:
    • 打开阿里云百炼控制台,在右上角选择目标地域
    • 进入模型体验页面,选择模型开始体验
  • 发起第一个API请求:首次调用千问API
  • 构建第一个大模型应用:0代码构建问答应用

八、常见问题

Q:我的数据安全吗?阿里云百炼会用我的数据进行训练吗?
A:不会。阿里云严格保护数据隐私,不会将您的数据用于模型训练。构建应用或训练模型时传输的所有数据均经过加密处理。

Q:阿里云百炼提供哪些地域的服务?不同地域有什么区别?
A:目前提供以下地域的模型服务:
华北2(北京)、美国(弗吉尼亚、国际(新加坡)和德国(法兰克福)地域

建议选择邻近地域以降低网络延迟。各地域的接入点(Endpoint/Base URL)不同,API Key 不通用,支持的模型、平台功能与价格也有所差异。

Q:如何避免产生费用?
A:百炼采用按量付费,本身没有"自动扣费"开关。以下措施可有效控制费用:

  • 删除API Key:前往阿里云百炼控制台,选择目标地域,进入API-KEY页面,删除所有API Key,从源头阻断调用。
  • 停止所有调用:停止应用程序、智能体、工作流中的模型调用,并排查定时任务和后台进程。
  • 清理计费资源:删除不再使用的知识库;前往模型部署页面,下线按算力时长计费的部署实例。
  • 开启"免费额度用完即停"(仅限新用户且在免费额度有效期内):在模型详情页开启此开关,免费额度耗尽后服务自动停止,不会转为付费。仅适用于华北2(北京)地域(中国内地服务部署范围),且须在免费额度有效期内。
  • 设置费用监控和预警:查看 账单详情和模型监控,并设置高额消费预警,及时发现异常消费。
  • 订阅 Coding Plan(AI 编码套餐):固定月费,提供月度请求额度,无按量扣费风险。注意需使用 Coding Plan 专属的 Base URL和API Key 进行调用,否则模型调用将按量付费。

Q:如何使用 Qwen3 系列模型或 DeepSeek?
A:

  1. 在线体验:打开阿里云百炼控制台,选择目标地域,进入模型广场页面,点击模型即可体验(DeepSeek 仅支持北京地域)。
  2. 通过API调用:请参见首次调用千问API
  3. 通过开发工具(如 Claude Code)调用:
  4. 通过可视化界面构建大模型应用:

Q:免费额度即将用完或已用完,是否有通知?
A:有通知。余量降至 20% 或完全耗尽时,系统通过短信、站内信、邮件发送通知。

如需开启或关闭预警、修改预警比例,请前往我的试用进行设置。找到试用规格描述为百炼大模型推理免费试用,单击查看试用详情,再单击右上角配置余量到期预警规则即可修改。

Q:免费额度用完会有什么影响?
A:对于全新未认证用户:免费额度用完后无法继续调用。需要完成认证后方可继续按量付费。

对于已认证用户:

  • 若已开启免费额度用完即停,免费额度用完后无法继续调用,需要关闭免费额度用完即停方可继续按量付费。
  • 若未开启免费额度用完即停,正在进行的调用不会中断,超出额度的Token将按控制台中的输入/输出价格计费,费用以按量后付费方式从阿里云账户扣除,可能导致账户欠费。

账户欠费时,即使其他模型仍有免费额度也无法调用。
调用前建议查询该模型剩余额度,并配置预算管理或账号余额预警,确保账户有充足余额,未使用的余额支持余额提现。

Q:如何查看免费额度消耗记录或账单?
A:调用结束几分钟后即可生成消耗记录。查询步骤:

  1. 在账单详情页面,选择账单月份,产品名称选择大模型服务平台百炼,单击搜索。
  2. 单击账单列表右上角的查看图标,找到用量信息,勾选抵扣用量,单击确定。
  3. 找到费用类型为免费额度的账单项,抵扣用量即为免费额度已抵扣的用量。

Q:为什么产生了费用?
A:常见原因:

  • 使用的模型已经没有免费额度。
  • 免费额度不支持抵扣OpenAI兼容-Batch(文件输入)产生的费用。
  • 控制台的免费额度数据为分钟级更新且需手动刷新。若未及时刷新,页面显示仍有额度但实际已耗尽,导致产生调用费用。操作前刷新页面,以最新显示为准。

Q:如何查看产生费用的模型?
A:调用结束几分钟后,在账单详情页面,选择账单月份,商品名称选择阿里云百炼大模型推理,单击搜索。在资产/资源实例ID 列查看产生费用的模型。

Q:如何查看模型调用记录?
A:模型调用完一小时后,在模型监控北京或新加坡页面设置查询条件(例如,选择时间范围、业务空间等),再在模型列表区域找到目标模型并单击操作列的监控,即可查看该模型的调用统计结果。

数据按小时更新,高峰期可能有小时级延迟,请您耐心等待。

p992753.png

Q:如何避免扣费?
A:超出免费额度后会自动从账号余额扣费。可通过以下方式降低扣费风险:

  • 删除已创建的 API-Key:进入阿里云百炼的API-Key(北京)或者(新加坡)页面,删除已创建的 API-Key。删除后将无法通过API调用模型,不再产生调用费用。
  • 设置高额消费预警:当产品日账单超过预警阈值时,每天短信提醒一次(统计截止昨日24点)。
    在预警产品下拉框中选择具体产品(如百炼大模型部署、百炼大模型推理、百炼大模型训练),在预警阈值输入框中填写金额(如0.01),然后单击增加即可添加预警规则。

Q:还有剩余额度,为何调用失败?
A:请检查阿里云账户是否欠费。账户欠费时,即使模型仍有免费额度也无法调用。

A:Q:为什么看不到免费额度与有效期?
免费额度列显示无免费额度或免费额度区域不显示,说明该账号下对应模型的免费额度已到期。

北京地域没有免费额度。

小结:阿里云百炼作为一站式大模型开发与应用平台,凭借兼容OpenAI的API规范、覆盖千问及DeepSeek等150+主流模型的能力,以及灵活的计费机制,极大降低了开发者接入大模型的门槛。无论是通过几行代码快速调用API,还是利用可视化工具零代码构建智能体应用,百炼都能满足不同角色的需求。平台提供的免费额度、按量付费、节省计划及Token订阅等多种计费方式,让用户可以根据自身业务规模灵活控制成本。加上数据不用于模型训练的隐私保障,以及完善的账单监控与预警机制,阿里云百炼为企业和开发者提供了一个安全、高效、可控的AI落地路径,是当前大模型应用开发的优质选择。

相关文章
|
2天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
7969 34
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
2天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
446 1
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
2天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
508 4
|
2天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
685 148
|
2天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1905 10
|
2天前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1309 2
|
2天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
2天前
|
人工智能 弹性计算 运维
阿里云发布堡垒机智能运维Agent,运维交互进入自然语言新时代
支持自然语言运维,提升效率与安全双保障。
1178 1
|
2天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
609 1
|
2天前
|
存储 定位技术 数据库
CodeGraph 如何让 Claude Code减少 7 成工具调用?
CodeGraph 为 Coding Agent 提供本地代码知识图谱,把函数、类、调用链和框架路由提前整理成“项目地图”,减少盲目搜索和文件读取。它不是新 Agent,而是上下文基础设施,让 Agent 更快找到正确代码路径,平均减少 7 成工具调用。
1340 4

热门文章

最新文章