阿里云百炼全模型通用抵扣AI节省计划是什么?使用Token更省钱吗?

简介: 阿里云百炼AI通用节省计划是面向大模型按量调用的折扣方案,承诺月消费(1000元起)即可享最高5.3折,覆盖千问、向量、语音、图像等全系阿里直供模型,支持工具调用、批量推理等费用自动抵扣,灵活高效降本。在阿里云百炼官网:https://t.aliyun.com/U/fPVHqY 免费领取千万Tokens

阿里云百炼全模型通用抵扣AI节省计划是什么?使用Token更省钱吗?是的。阿里云AI模型节省计划是阿里云大模型服务平台百炼提供的一种针对大模型按量付费使用场景的折扣计费方案,旨在帮助用户在保持使用灵活性的同时显著降低模型调用成本,阿小云整理ai节省计划种类、使用、折扣及问题解答FAQ,在:阿里云百炼AI大模型平台 开通和购买AI通用节省计划及资源包。

阿里云百炼AI大模型平台.jpg

AI模型节省计划种类(共3种)

  • AI 通用型节省计划(推荐)
  • 用户承诺在一定期限内(3/6/12/24个月)每月消费固定金额(1000元起),即可享受阶梯式折扣,最高可达5.3折。
  • 覆盖全面:可抵扣阿里直供的全部大模型(如千问系列、向量模型、语音、图像、视频等),一次购买跨模型通用。
  • 自动抵扣:无需手动绑定,按抵扣顺序(免费额度 > 资源包 > 其他节省计划 > AI通用型节省计划)自动生效。
  • 不支持抵扣:模型调优、模型部署、MCP广场及模型体验中的联网搜索费用。
  • 支持“全预付”和“零预付”(需商务白名单)两种付费方式。


  • 其他模型节省计划
  • 针对特定模型系列(如万相、语音模型等)的一次性固定金额购买方案。
  • 折扣通常低于AI通用型节省计划,仅适用于指定模型,且 不支持工具调用、上下文缓存、批量推理等费用抵扣
  • 资源包
  • 一次性购买具体资源量(如Tokens数、图片生成张数等),仅适用于单个特定模型(如qwen-plus)。
  • 灵活性和折扣力度均低于AI通用型节省计划,适合用量明确且集中的场。


本文阿小云着重介绍AI通用节省计划。


AI通用节省计划核心优势

AI 通用型节省计划是针对大模型按量付费使用场景设计的折扣方案。只需承诺在一定期限内(3 个月、6 个月、12 个月或 24 个月)的月消费金额,即可在保留按量付费灵活性的基础上,享受阶梯式折扣,优化模型调用成本。其核心优势如下:

  • 覆盖全面:可抵扣阿里直供的全部模型,一次购买即可跨模型使用。
  • 成本优化显著:承诺消费金额越高、周期越长,折扣力度越大,最高可享 5.3 折优惠。
  • 管理流程便捷:购买后可立即或按指定时间生效,无需手动激活或绑定,自动抵扣,支持自动续费。


使用说明

生效时间:可按需选择“开通后立即生效”或“指定时间(按小时)生效”。

承诺周期说明以月为单位(从生效日到下个月的对应日),月承诺周期结束时,剩余额度自动过期,不可累积到下一周期。举例:如果一次性订阅了 3 个月的节省计划(月承诺额度 1000 元),并非在 3 个月内获得 3000 元总额度,而是每月独立获得 1000 元额度,当月未使用完的部分自动清零,不可累积到下个订阅月。

抵扣范围

  • 支持抵扣:模型调用(输入和输出 Tokens)、模型原生工具调用(如 Function Call、联网搜索、网页抓取等)、上下文缓存、批量推理等产生的费用。
  • 不支持抵扣:模型调优、模型部署的费用,以及 MCP 广场和模型体验的联网搜索的费用。

抵扣逻辑

  • 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费
  • 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
  • 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。


AI通用节省计划购买指引

购买方式

点击购买 AI 通用型节省计划链接

适用地域

华北2(北京)、美国(弗吉尼亚)、新加坡、德国(法兰克福)

支持的抵扣范围

不同档位享受不同的折扣。

  • A 类:千问(不含 qwen3.6-max-preview)、千问-开源、文本向量、多模态向量、排序模型、行业模型、模型原生工具调用(Function Calling、联网搜索、网页抓取等;不含 MCP 广场和模型体验的联网搜索)
  • B 类:图像生成、语音合成、语音识别与翻译、视频生成与编辑
  • C 类:qwen3.6-max-preview、DeepSeek、Kimi、GLM、MiniMax、HappyHorse
    三方直供模型不支持抵扣,详情参见 三方直供模型支持抵扣 AI 通用型节省计划吗?

每月承诺消费金额

用于抵扣模型服务按量计费的每月承诺消费额。可自定义金额,1000 元起,以 10 元为单位调整,不设上限。

承诺周期

可选择以下四个档位的承诺周期:3个月、6个月、12个月、24个月

付费方式

  • 全预付:一次性支付整个承诺周期内的全部承诺消费金额,可享最大折扣。
  • 零预付:购买时无需支付,之后按月支付承诺消费金额。零预付需联系商务经理开通白名单后使用。

折扣

请参考折扣信息

开通时间选择

可按需选择“开通后立即生效”或“指定时间(按小时)生效”。


AI大模型节省计划折扣信息

不同模型、不同档位、承诺周期和付款方式享受不同的折扣。

例如:选择了为期 12 个月、每月承诺消费 10,000 元的节省计划,采用全预付的方式支付,此时调用千问文本生成模型(A 类)时,享受 8 折优惠,即一次原价 1 元的模型调用,实际从节省计划额度中抵扣 0.8 元。


付款方式

月承诺金额(元)

A 类

B 类

C 类

3个月

6个月

12个月

24个月

3个月

6个月

12个月

24个月

全周期

全预付

[1,000, 5,000)

8.8折

8.6折

8.4折

8.2折

8.3折

8折

7.7折

7.4折

无折扣

[5,000, 10,000)

8.6折

8.4折

8.2折

8折

8折

7.7折

7.4折

7.1折

无折扣

[10,000, 30,000)

8.4折

8.2折

8折

7.8折

7.7折

7.4折

7.1折

6.8折

无折扣

[30,000, 50,000)

8.2折

8折

7.8折

7.6折

7.4折

7.1折

6.8折

6.5折

无折扣

[50,000, 100,000)

8折

7.8折

7.6折

7.4折

7.1折

6.8折

6.5折

6.2折

无折扣

[100,000, 300,000)

7.8折

7.6折

7.4折

7.2折

6.8折

6.5折

6.2折

5.9折

无折扣

[300,000, 1,000,000)

7.6折

7.4折

7.2折

7折

6.5折

6.2折

5.9折

5.6折

无折扣

[1,000,000, ~)

7.4折

7.2折

7折

6.8折

6.2折

5.9折

5.6折

5.3折

无折扣

零预付

需联系商务经理开通

[1,000, 5,000)

9折

8.8折

8.6折

8.4折

8.5折

8.2折

7.9折

7.6折

无折扣

[5,000, 10,000)

8.8折

8.6折

8.4折

8.2折

8.2折

7.9折

7.6折

7.3折

无折扣

[10,000, 30,000)

8.6折

8.4折

8.2折

8折

7.9折

7.6折

7.3折

7折

无折扣

[30,000, 50,000)

8.4折

8.2折

8折

7.8折

7.6折

7.3折

7折

6.7折

无折扣

[50,000, 100,000)

8.2折

8折

7.8折

7.6折

7.3折

7折

6.7折

6.4折

无折扣

[100,000, 300,000)

8折

7.8折

7.6折

7.4折

7折

6.7折

6.4折

6.1折

无折扣

[300,000, 1,000,000)

7.8折

7.6折

7.4折

7.2折

6.7折

6.4折

6.1折

5.8折

无折扣

1,000,000 及以上

7.6折

7.4折

7.2折

7折

6.4折

6.1折

5.8折

5.5折

无折扣


生命周期管理

访问节省计划总览页面管理节省计划。

节省计划续订

登录费用与成本控制台,左侧菜单选择费用 > 我的订阅,查看并管理节省计划的订阅状态、生效时间、自动续费状态等。


查询折扣

在 AI 通用型节省计划中,不同模型、不同档位、承诺周期和付款方式享受不同的折扣。可以访问节省计划价格折扣详情页面,按以下条件筛选查询:

  • 适用商品:参考下表选择对应的商品名称。
  • 被抵扣计费项:参考下表选择对应的计费项。
  • 节省计划类型:选择 AI 通用型节省计划/百炼AI通用型节省计划。
  • 订购时长支付方式:选择对应的选项,查看按量折扣。


适用商品

被抵扣计费项

百炼大模型推理

文本:文本生成Token用量

图片:图片生成张数用量、多规格图片生成张数用量、图片检测张数用量

视频:视频生成时长用量

语音:语音合成字数用量、语音识别时长用量、Cosyvoice语音合成字数用量、声音复刻及声音设计模型个数用量

向量:多模态向量模型用量、文本向量模型用量

批量调用:Batch模型用量、BatchChat模型用量、BatchChat Token用量、BatchChat视频生成时长用量

工具调用:计次用量

以及上述各计费项对应的全局用量。

查询华北2(北京)地域的调用费用折扣时,选择非全局计费项;查询其他地域时,选择对应的全局计费项。

百炼大模型-垂类模型

文本生成Token用量

阿里云百炼大模型-向量排序模型

多模态向量模型用量

百炼大模型-千问语音模型

语音合成字数用量、语音识别时长用量

百炼大模型-百聆语音模型

语音合成字数用量、语音识别时长用量

百炼大模型-万相模型

图片生成张数用量、视频生成时长用量


查询账单

进入费用与成本控制台,左侧菜单选择,产品名称选择大模型服务平台百炼商品名称选择 AI 通用型节省计划。页面默认展示当月明细账单。详情请参考如何查询节省计划账单


常见问题

节省计划和资源包是否支持退订?

  • 节省计划:自 2026 年 04 月 03 日 10:00:00(UTC+8)起,符合以下条件的节省计划支持自助退订,可在资源退订控制台中操作:
  • 未生效的全预付节省计划。
  • 已生效但未发生任何抵扣的全预付节省计划。
  • 若购买的节省计划已发生抵扣,暂不支持退订。
  • 资源包:未发生使用的部分,可按未使用额度费用申请退款;已使用的部分则无法退款。

资源包和节省计划如果同时存在,怎么扣费?

系统的抵扣优先级为:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费。即:先用免费额度;用完后扣资源包;资源包不够或不适用时,扣节省计划;最后才使用账户余额。

为什么购买了节省计划,但没有抵扣?

常见原因如下:

  1. 模型不匹配:购买了其他节省计划,但调用的模型不在适用范围内。例如:购买了大语言模型节省计划,却调用了万相系列模型或向量模型(embedding)、排序模型(rerank)。可以选择购买 AI 通用型节省计划以实现跨模型抵扣。
  2. 使用了不支持的功能:AI 通用型节省计划和其他节省计划均不支持抵扣模型调优、模型部署费用。只有 AI 通用型节省计划支持抵扣上下文缓存、批量推理、工具调用等产生的费用,而其他节省计划不支持。
  3. 免费额度未用完:系统抵扣顺序为:免费额度 > 节省计划。节省计划仅抵扣免费额度用尽后产生的账单。

三方直供模型支持抵扣 AI 通用型节省计划吗?

C 类模型中,阿里直供的模型支持抵扣,三方直供的模型不支持抵扣。可以在百炼模型广场中通过模型卡片右上角标识判断。

为什么购买了资源包,但没有抵扣?

资源包的抵扣需要满足特定条件,常见原因如下:

  1. 模型不匹配:调用的模型与购买的资源包不一致。例如,购买 qwen-max 资源包却调用了 qwen-plus 模型。
  2. 使用了不支持的功能:资源包不支持抵扣这些功能产生的费用:批量推理(Batch)、上下文缓存、模型调优、模型部署。
  3. Token 长度超限:对于 qwen-plus 资源包,单次请求输入超过 128K Token 的部分无法抵扣。
  4. 免费额度未用完:系统抵扣顺序为:免费额度 > 资源包。资源包仅抵扣免费额度用尽后产生的账单。

如果先购买了资源包但未开通阿里云百炼服务,应该如何使用?

请先开通阿里云百炼的模型服务。服务开通后,优先会抵扣免费额度,待免费额度消耗完后,才会开始抵扣资源包。

购买了大语言模型节省计划,能抵扣向量模型(embedding)和排序模型(rerank)吗?

不能。大语言模型推理节省计划仅适用于文本生成模型,不支持抵扣向量模型和排序模型。如果您的业务同时涉及大语言模型与向量、排序模型(例如 RAG 场景),建议选择AI 通用型节省计划,或单独购买向量及排序模型节省计划。

相关文章
|
11天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
11天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
844 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
11天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
857 7
|
11天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
11天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2313 6
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
11天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
1881 6
|
11天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
785 150
|
11天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
633 2