阿里云千问Token价格怎么收费?模型、区域、输入/输出长度及调用模式影响价格整理,阿里云千问(Qwen)系列模型的Token收费根据具体模型、部署区域、调用模式(如是否Batch调用、是否启用上下文缓存)、输入/输出长度以及是否为思考模式等因素有所不同。详细参考阿里云通义大模型官方平台:https://www.aliyun.com/product/tongyi 如下图:
以下是主要计费情况:
1. 千问Max(qwen3-max)
- 中国内地部署(北京地域):
- 输入0–32K Token:输入2.5元/百万Token,输出10元/百万Token;
- 输入32K–128K Token:输入4元/百万Token,输出16元/百万Token;
- 输入128K–252K Token:输入7元/百万Token,输出28元/百万Token;
- 支持Batch调用时,输入和输出单价均为实时推理价格的50%;若启用上下文缓存,仅输入Token享折扣(两者不叠加);
- 免费额度:各100万Token(开通后90天内有效)
- 国际部署(新加坡地域):
- qwen-max / qwen-max-latest 等:输入11.743元/百万Token,输出46.971元/百万Token;
- 无免费额度
- 金融云部署:
- 输入38元/百万Token,输出114元/百万Token;
- 免费额度:100万Token(90天内有效)
免费Token领取:
开通阿里云百炼平台:https://www.aliyun.com/product/bailian 免费领取超7000万tokens,如下图:
2. 千问Plus(qwen3.5-plus)
- 中国内地部署:
- 输入0–128K Token:输入0.8元/百万Token,输出4.8元/百万Token;
- 输入128K–256K Token:输入2元/百万Token,输出12元/百万Token;
- 输入256K–1M Token:输入4元/百万Token,输出24元/百万Token;
- 思考与非思考模式输出价格相同;
- 免费额度:各100万Token(90天内有效)
3. 千问Long(qwen-long)
- 中国内地部署:
- 输入0.5元/百万Token,输出2元/百万Token;
- Batch调用享50%折扣;
- 免费额度:各100万Token(90天内有效)
4. 千问Omni(qwen3-omni-flash)
- 中国内地部署,支持多模态:
- 文本输入:1.8元/百万Token;音频输入:15.8元/百万Token;图片/视频输入:3.3元/百万Token;
- 纯文本输出:6.9元/百万Token;多模态输入下的文本输出:12.7元/百万Token;仅音频计费的输出:62.6元/百万Token;
- 免费额度:各100万Token(90天内有效)
5. 通义点金(金融领域应用)
- 标准版:0.01元/千Token;
- 高级版:0.1元/千Token;
- 按实际消耗Token后付费
6. 全妙轻应用系列(如电商文案、VOC挖掘等)
- 千问-Plus:输入0.8元/百万Token(即¥0.0008/千Token),输出2元/百万Token(¥0.002/千Token);
- 千问-Max:输入2.4元/百万Token(¥0.0024/千Token),输出9.6元/百万Token(¥0.0096/千Token);
- Qwen-Long:输入0.5元/百万Token(¥0.0005/千Token),输出2元/百万Token(¥0.002/千Token)
注:所有计费均按输入Token + 输出Token分别计价,部分场景支持Batch调用半价或上下文缓存折扣,但不可同时生效
也可以在阿里云百炼平台查看最新精准的千问大模型收费价格:https://www.aliyun.com/product/bailian