阿里云百炼大模型收费价格:调用、调优和部署费用清单

简介: 阿里云百炼开通免费,调用、调优、部署按需计费。每个模型享100万Tokens免费额度,超量后计费。含推理(按Token阶梯计价)、训练(按数据量)和部署(按时长或调用量)三项费用,详情见官方文档。

阿里云百炼大模型收费价格:调用、调优和部署费用清单,阿里云百炼AI大模型平台是如何收费的?开通阿里云百炼是免费的,只有调用、部署、调优模型才会产生费用,注意:因为阿里云为每个模型免费提供100万Tokens的额度,所以只有当超出免费额度后,才会计费。阿小云整理详细费用计费说明:

阿里云百炼费用计费说明

首先,开通阿里云百炼并不会产生费用,调用、部署、调优模型会产生相应费用(超出免费额度后)。例如:调用大模型实现文本生成、图片生成、语音合成等任务时,会产生模型推理(调用)费用,此外,如果训练(调优)新模型或将模型部署到实例也会产生费用。如下图:

阿里云百炼大模型计费说明

阿里云百炼大模型计费说明

阿里云百炼计费项目包括3项,即模型推理(调用)、模型训练(调优)和模型部署,详细参考阿里云百炼官方平台:https://www.aliyun.com/product/bailian

计费项1、模型推理(调用)

模型推理费用通俗来讲就是调用的产生的费用,推理价格计费公式如下:

  • 计费公式:费用 = 调用消耗量 × 单价

根据上面的计费公式,调用消耗量很好理解,阿里云系统根据用户的后台调用实际消耗量(在百炼后台可查询),然后乘以大模型的单价费用,单价费用的单位一般按照每千Token计费。关于大模型的费用价格,阿里云百科以qwen3-max-preview模型为例,大家可以参考下,该模型根据输入Token数,采取阶梯计费:

输入Token数 输入价格(每千Token)
qwen3-max-preview 支持上下文缓存
输出价格(每千Token)
0-32K 0.006元 0.024元
32K-128K 0.01元 0.04元
128K-252K 0.015元 0.06元

更多模型及详细计费说明,请参考阿里云百炼官方定价文档:https://help.aliyun.com/zh/model-studio/models

计费项2、模型训练(调优)

模型训练即调优,如何进行模型训练请参考模型调优:https://help.aliyun.com/zh/model-studio/model-training-overview

模型训练的费用是按照按训练数据量计费的,计费公式如下:

  • 费用 = (训练数据 Token 数 + 混合训练数据 Token 数)× 循环次数 × 训练单价
    开始训练前会显示预估费用和计费详情,模型训练后获得的新模型必须进行模型部署才能评测和调用。

计费项3、模型部署

调优后的模型需要经过部署才能提供推理服务,模型部署后,将提供高并发、低延迟的推理服务,关于模型部署请参考官方文档:https://help.aliyun.com/zh/model-studio/model-deployment

关于模型部署的费用,有两种计费方式,可以按时间计费,也可以选择按模型调用量计费:如下图:

模型部署计费:按时间和按调用量

模型部署计费:按时间和按调用量

按时间计费适合大模型推理服务有低延迟、高SLA需求的场景;按模型调用量计费适合对模型训练的结果进行快速验证,大家根据自身实际情况选择模型部署计费方式。

以上是阿小云整理的阿里云百炼平台收费说明,首先开通百炼是不收费的,不仅不收费还会额外赠送每个模型100万Tokens的免费额度,默认会先使用免费额度,免费的用完了才会收费。关于百炼的计费项,包括三个项目,即模型推理(调用)、模型训练(调优)和模型部署费用。更多关于阿里云百炼费用的详细说明,请移步到百炼官方页面:https://www.aliyun.com/product/bailian

相关文章
|
9天前
|
弹性计算 关系型数据库 微服务
基于 Docker 与 Kubernetes(K3s)的微服务:阿里云生产环境扩容实践
在微服务架构中,如何实现“稳定扩容”与“成本可控”是企业面临的核心挑战。本文结合 Python FastAPI 微服务实战,详解如何基于阿里云基础设施,利用 Docker 封装服务、K3s 实现容器编排,构建生产级微服务架构。内容涵盖容器构建、集群部署、自动扩缩容、可观测性等关键环节,适配阿里云资源特性与服务生态,助力企业打造低成本、高可靠、易扩展的微服务解决方案。
1199 4
|
8天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
1146 87
|
7天前
|
机器学习/深度学习 物联网
Wan2.2再次开源数字人:Animate-14B!一键实现电影角色替换和动作驱动
今天,通义万相的视频生成模型又又又开源了!Wan2.2系列模型家族新增数字人成员Wan2.2-Animate-14B。
609 11
|
18天前
|
人工智能 运维 安全
|
9天前
|
云栖大会
阿里云云栖大会2025年9月24日开启,免费申请大会门票,速度领取~
2025云栖大会将于9月24-26日举行,官网免费预约畅享票,审核后短信通知,持证件入场
1726 12
|
1天前
|
资源调度
除了nrm-pm,还有哪些工具可以管理多个包管理器的源?
除了nrm-pm,还有哪些工具可以管理多个包管理器的源?
227 127
|
9天前
|
弹性计算 Kubernetes jenkins
如何在 ECS/EKS 集群中有效使用 Jenkins
本文探讨了如何将 Jenkins 与 AWS ECS 和 EKS 集群集成,以构建高效、灵活且具备自动扩缩容能力的 CI/CD 流水线,提升软件交付效率并优化资源成本。
354 0
|
9天前
|
消息中间件 Java Apache
SpringBoot集成RocketMq
RocketMQ 是一款开源的分布式消息中间件,采用纯 Java 编写,支持事务消息、顺序消息、批量消息、定时消息及消息回溯等功能。其优势包括去除对 ZooKeeper 的依赖、支持异步和同步刷盘、高吞吐量及消息过滤等特性。RocketMQ 具备高可用性和高可靠性,适用于大规模分布式系统,能有效保障消息传输的一致性和顺序性。
525 2

热门文章

最新文章