阿里云AI大模型的Token收费价格因模型类型、部署区域、输入/输出长度及是否启用“思考模式”等因素而异。以下是主要模型的计费标准(单位:元/每百万Token),在阿里云百炼平台查询精准报价:https://t.aliyun.com/U/fPVHqY
一、千问Max 系列(中国内地以外部署)
国际(如新加坡)
- qwen3.6-max-preview / qwen3-max:
- 输入:0–128K Token → 9.742 元;128K–256K → 14.988 元
- 输出(思维链+回答):0–128K → 58.455 元;128K–256K → 89.93 元
欧盟(德国法兰克福)
- qwen3-max:
- 输入:0–32K → 8.993 元;32K–128K → 17.986 元;128K–256K → 22.483 元
- 输出:0–32K → 44.965 元;32K–128K → 89.93 元;128K–256K → 112.413 元
二、千问Plus 系列(中国内地,北京)
- qwen3.6-plus / qwen3.5-plus 等:
- 输入:0–256K → 2 元;256K–1M → 8 元
- 输出(非思考/思考模式相同):0–256K → 12 元;256K–1M → 48 元
- 免费额度:开通百炼后90天内,输入和输出各享100万Token免费
注:Batch调用可享50%折扣,例如 qwen-plus Batch 调用在0–128K输入下,输出单价低至2元(非思考)或8元(思考)。
三、千问VL(多模态视觉语言模型,欧盟)
- qwen3-vl-plus:
- 输入:0–32K → 1.499 元;32K–128K → 2.248 元;128K–256K → 4.497 元
- 输出:0–32K → 11.991 元;32K–128K → 17.986 元;128K–256K → 35.972 元
- qwen3-vl-flash(更低成本):
- 输入:0–32K → 0.375 元;输出:2.998 元
四、千问Coder(代码生成模型)
全球(美国、德国)
- qwen3-coder-plus:
- 输入:0–32K → 4 元;输出:16 元
- 256K–1M:输入 20 元,输出高达 200 元
- qwen3-coder-flash(轻量版):
国际(不含中国内地)
- qwen3-coder-plus:
- 0–32K 输入 → 7.339 元,输出 → 36.696 元
- 256K–1M 输入 → 44.035 元,输出 → 440.354 元
五、开源版 Qwen3(全球)
- qwen3-8b:输入 0.5 元,输出 2 元(非思考)或 5 元(思考)
- qwen3-14b:输入 1 元,输出 4 元 或 10 元
- qwen3-30b-a3b:输入 0.75 元,输出 3 元 或 7.5 元
- qwen3-235b-a22b:输入 2 元,输出 8 元(非思考)或 20 元(思考)
⚠️ 注意:
- 国际和欧盟部署无免费额度;
- 中国内地部分模型(如Plus系列)提供90天内各100万Token免费;
- “思考模式”通常指启用思维链(Chain-of-Thought),输出价格更高;
- 实际费用 =(输入Token数 × 输入单价 + 输出Token数 × 输出单价)÷ 1,000,000。
以上价格均来自阿里云百炼平台官方计费文档。建议根据实际使用场景选择合适模型以优化成本。