阿里云AI通用节省计划是什么意思?Tokens如何计费?包含多少Tokens?

简介: 阿里云AI通用节省计划是面向大模型按量付费的折扣机制,用户承诺月消费金额(如200元/年),即可享最高5.3折优惠。它不直接提供固定Tokens,而是按调用模型单价自动抵扣输入/输出Tokens等费用,覆盖全部阿里直供模型,支持灵活生效与自动续费。

阿里云AI通用节省计划是什么意思?Tokens如何计费?包含多少Tokens?阿里云入门型AI通用节省计划是什么?包含多少Tokens?AI通用型节省计划的入门版本并不直接以Tokens形式提供资源额度,而是以承诺消费金额 (如200元/年)的形式进行抵扣,适用于符合条件的大模型按量付费推理费用。节省计划本身不是资源包,而是一种计费优化机制,需与按量付费配合使用,系统会优先用节省计划额度抵扣账单。在阿里云权益中心:https://www.aliyun.com/benefit  可以申请AI权益,如下图:

aijieshengjihuaaly.jpg

目前阿里云有个OpenClaw部署成本78元套餐活动,包含68元一年的轻量应用服务器和10元的入门型AI通用节省计划,如下图:


所以,AI通用节省计划是一种AI大模型按量付费的计费形式,所以具体可抵扣多少Tokens数量取决于所调用模型的计费单价。

什么是节省计划?节省计划是一种折扣权益计划,用户通过承诺在一定期限内每月消费一定金额,即可在使用大模型按量付费服务时,享受阶梯式折扣优惠。AI通用型节省计划套餐不直接提供固定的Tokens,而是以承诺月消费金额为基础,用于抵扣符合条件的大模型调用费用。


更多关于节省计划与资源包的详细介绍,请参考阿里云官方文档:https://help.aliyun.com/zh/model-studio/savings-plan-and-resource-package  如下图:

ai节省计划.jpg

AI 通用型节省计划官方介绍

核心优势

AI 通用型节省计划是针对大模型按量付费使用场景设计的折扣方案。只需承诺在一定期限内(3 个月、6 个月、12 个月或 24 个月)的月消费金额,即可在保留按量付费灵活性的基础上,享受阶梯式折扣,优化模型调用成本。其核心优势如下:

  • 覆盖全面:可抵扣阿里直供的全部模型,一次购买即可跨模型使用。
  • 成本优化显著:承诺消费金额越高、周期越长,折扣力度越大,最高可享 5.3 折优惠。
  • 管理流程便捷:购买后可立即或按指定时间生效,无需手动激活或绑定,自动抵扣,支持自动续费。

使用说明

生效时间:可按需选择“开通后立即生效”或“指定时间(按小时)生效”。

承诺周期说明以月为单位(从生效日到下个月的对应日),月承诺周期结束时,剩余额度自动过期,不可累积到下一周期。举例:如果一次性订阅了 3 个月的节省计划(月承诺额度 1000 元),并非在 3 个月内获得 3000 元总额度,而是每月独立获得 1000 元额度,当月未使用完的部分自动清零,不可累积到下个订阅月。

抵扣范围

  • 支持抵扣:模型调用(输入和输出 Tokens)、工具调用、上下文缓存、批量推理等产生的费用。
  • 不支持抵扣:模型调优、模型部署产生的费用。

抵扣逻辑

  • 抵扣顺序:免费额度 > 资源包 > 其他模型节省计划 > AI 通用型节省计划 > 按量付费
  • 多个同类型的节省计划:优先抵扣先到期的节省计划。若到期时间相同,则优先抵扣先购买的节省计划。
  • 超出部分处理:如果同类节省计划全部到期或额度全部抵扣完后,仍有超出部分,自动转为按量付费。
相关文章
|
存储 缓存 文件存储
如何保证分布式文件系统的数据一致性
分布式文件系统需要向上层应用提供透明的客户端缓存,从而缓解网络延时现象,更好地支持客户端性能水平扩展,同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候,由于在客户端上引入了多个本地数据副本(Replica),就相应地需要提供客户端对数据访问的全局数据一致性。
32698 79
如何保证分布式文件系统的数据一致性
|
前端开发 容器
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局(上)
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局
17753 20
|
设计模式 存储 监控
设计模式(C++版)
看懂UML类图和时序图30分钟学会UML类图设计原则单一职责原则定义:单一职责原则,所谓职责是指类变化的原因。如果一个类有多于一个的动机被改变,那么这个类就具有多于一个的职责。而单一职责原则就是指一个类或者模块应该有且只有一个改变的原因。bad case:IPhone类承担了协议管理(Dial、HangUp)、数据传送(Chat)。good case:里式替换原则定义:里氏代换原则(Liskov 
36684 19
设计模式(C++版)
|
存储 编译器 C语言
抽丝剥茧C语言(初阶 下)(下)
抽丝剥茧C语言(初阶 下)
|
机器学习/深度学习 人工智能 自然语言处理
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
24758 14
|
机器学习/深度学习 弹性计算 监控
重生之---我测阿里云U1实例(通用算力型)
阿里云产品全线降价的一力作,2023年4月阿里云推出新款通用算力型ECS云服务器Universal实例,该款服务器的真实表现如何?让我先测为敬!
36662 15
重生之---我测阿里云U1实例(通用算力型)
|
SQL 存储 弹性计算
Redis性能高30%,阿里云倚天ECS性能摸底和迁移实践
Redis在倚天ECS环境下与同规格的基于 x86 的 ECS 实例相比,Redis 部署在基于 Yitian 710 的 ECS 上可获得高达 30% 的吞吐量优势。成本方面基于倚天710的G8y实例售价比G7实例低23%,总性价比提高50%;按照相同算法,相对G8a,性价比为1.4倍左右。
|
存储 算法 Java
【分布式技术专题】「分布式技术架构」手把手教你如何开发一个属于自己的限流器RateLimiter功能服务
随着互联网的快速发展,越来越多的应用程序需要处理大量的请求。如果没有限制,这些请求可能会导致应用程序崩溃或变得不可用。因此,限流器是一种非常重要的技术,可以帮助应用程序控制请求的数量和速率,以保持稳定和可靠的运行。
29838 52

热门文章

最新文章

下一篇
开通oss服务