阿里云百炼大模型服务平台已经接入的主要模型有哪些?调用计费收费标准,新人免费额度介绍

简介: 阿里云百炼是一个集成了通义千问系列及DeepSeek、Kimi等主流第三方模型的一站式大模型开发与应用平台,提供全链路模型服务及可视化应用构建能力。其模型包括文本生成与理解、多模态模型、第三方开源模型及专用工具模型,支持多地域与版本选择。新用户可享7000万tokens限免体验及100+Agent模板。计费上,部分模型采用阶梯计费,单价依输入/输出Token总量定,支持Batch调用和上下文缓存折扣,具体计费标准可通过百炼控制台查询。

阿里云百炼是一站式大模型开发与应用平台,集成了通义千问(Qwen)系列模型及DeepSeek、Kimi等主流第三方模型。它为开发者提供了兼容OpenAI的API及全链路模型服务;同时,也提供可视化应用构建能力,让业务人员能快速创建智能体、知识库问答等AI应用。

2026阿里云百炼产品.png

一、阿里云百炼大模型服务平台接入的官网模型分类及列表

1. 通义千问(Qwen)系列模型

核心旗舰模型:

  • Qwen-Max:效果最强的模型,适合复杂任务(如多步骤推理、专业分析)。最新版本为Qwen3.6-Max-Preview,在推理能力上全面超越前代。
  • Qwen-Plus:平衡性能与成本,适用于多数通用场景(如内容创作、客服问答)。
  • Qwen-Flash:高性价比、低延迟模型,适合简单任务(如快速响应、基础对话)。

2025年9月新发布模型:

  • Qwen3-Next:基于高稀疏度混合专家(MoE)架构,总参数800亿,激活参数30亿,推理成本显著降低。
  • Qwen3-Next-80B-A3B系列:包括Qwen3-Next-80B-A3B-Instruct和Thinking模型,支持高效训练与推理。
  • Qwen3-Max-Preview:参数超1万亿,支持256K tokens上下文窗口,覆盖100+语言。

细分领域模型:

  • 文本生成:长文本处理、翻译、数据挖掘、法律、意图理解等专用模型。
  • 角色扮演(Qwen-Character):支持个性化角色设定与自然对话交互。

2. 多模态模型

  • 文本生成与理解:Qwen-VL-Max、Qwen-VL-Plus(支持图像生成与分析)。
  • 图像与视频生成:通义万相系列(如图像生成、视频编辑、风格迁移)。
  • 语音与音频:语音识别、语音合成、音频内容分析等能力。

3. 第三方开源模型

  • DeepSeek:支持多语言对话与代码生成(如DeepSeek 7、DeepSeek 128B)。
  • Kimi:专注于多轮对话与复杂任务处理。
  • GLM系列:如GLM-130B、GLM-256B等,覆盖文本生成与科学计算场景。
  • Llama系列:部分开源模型通过百炼平台提供调用接口(需确认具体地域支持)。

4. 专用工具模型

  • Qwen-Embedding:文本向量化模型(如text-embedding-v4),支持语义搜索与相似度计算。
  • Qwen-Code系列:如Qwen3-Coder,专为代码理解和生成优化。
  • 妙搜(MagicSearch):结合大模型与多源数据检索的问答增强模型,支持深度搜索与跨模态分析。

5. 地域与版本差异

  • 主要地域支持:北京(华北2)、新加坡、美国(弗吉尼亚)。
    • 北京地域:支持全系列通义模型及第三方模型(如DeepSeek)。
    • 国际地域:新加坡、美国支持部分模型,需通过对应地域API入口调用。

重要提醒

  • 模型版本迭代:部分模型名称可能随更新调整(如Qwen3-Max-Preview为测试版本,后续可能升级为正式版)。
  • 计费差异:旗舰模型(如Qwen-Max)调用成本高于基础模型(如Qwen-Flash),需根据业务需求选择。
  • API兼容性:支持OpenAI接口规范,可快速迁移代码(需替换API Key与模型名称)。

二、新人免费额度介绍

当您首次开通阿里云百炼时,平台会自动为您发放各模型的新人专属免费额度。百炼平台提供7000万tokens限免体验,支持100+Agent模板一键复制。通义千问-Image可免费生成100张图像,具备复杂文本渲染能力;Qwen3-Coder支持代码生成与工具调用;通义千问3支持119种语言,每款模型提供100万免费tokens。用户可通过百炼大模型服务平台进入免费体验:https://www.aliyun.com/product/bailian

大模型服务.png

三、百炼大模型调用计费收费标准

1、阶梯计费规则

百炼部分模型实行阶梯计费。单价取决于单次请求的输入 Token 总量。该请求的所有 Token 均按对应阶梯的单价结算。

例如,某模型设有两档计费区间:0 < Token ≤ 32K 和 32K < Token ≤ 128K。若输入 100K Token,因数值落在第二区间(32K < 100K ≤ 128K),所有 Token 均按第二档单价结算。

2、文本生成-千问

2.1 千问Max

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

1.中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3.6-max-preview > 上下文缓存享有折扣 非思考和思考模式 0<Token≤128K 9元 54元
qwen3.6-max-preview > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 15元 90元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 2.5元 10元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 4元 16元
qwen3-max > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 7元 28元
qwen3-max-2026-01-23 非思考和思考模式 0<Token≤32K 2.5元 10元
qwen3-max-2026-01-23 非思考和思考模式 32K<Token≤128K 4元 16元
qwen3-max-2026-01-23 非思考和思考模式 128K<Token≤256K 7元 28元
qwen3-max-2025-09-23 仅非思考模式 0<Token≤32K 6元 24元
qwen3-max-2025-09-23 仅非思考模式 32K<Token≤128K 10元 40元
qwen3-max-2025-09-23 仅非思考模式 128K<Token≤256K 15元 60元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 6元 24元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 10元 40元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 15元 60元

更多模型

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen-max > Batch调用半价 仅非思考模式 无阶梯计价 2.4元 9.6元
qwen-max-latest > Batch调用半价 仅非思考模式 无阶梯计价 2.4元 9.6元
qwen-max-2025-01-25 仅非思考模式 无阶梯计价 2.4元 9.6元
qwen-max-2024-09-19 仅非思考模式 无阶梯计价 20元 60元
qwen-max-2024-04-28 仅非思考模式 无阶梯计价 40元 120元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

说明:全球部署范围下的模型无免费额度。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-max > 上下文缓存享有折扣 仅非思考模式 0<Token≤32K 2.5元 10元
qwen3-max > 上下文缓存享有折扣 仅非思考模式 32K<Token≤128K 4元 16元
qwen3-max > 上下文缓存享有折扣 仅非思考模式 128K<Token≤256K 7元 28元
qwen3-max-2025-09-23 仅非思考模式 0<Token≤32K 6元 24元
qwen3-max-2025-09-23 仅非思考模式 32K<Token≤128K 10元 40元
qwen3-max-2025-09-23 仅非思考模式 128K<Token≤256K 15元 60元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 6元 24元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 10元 40元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 15元 60元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际部署范围下的模型无免费额度。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3.6-max-preview > 上下文缓存享有折扣 非思考和思考模式 0<Token≤128K 9.742元 58.455元
qwen3.6-max-preview > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 14.988元 89.93元
qwen3-max > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 8.807元 44.035元
qwen3-max > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 17.614元 88.071元
qwen3-max > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 22.018元 110.089元
qwen3-max-2026-01-23 非思考和思考模式 0<Token≤32K 8.807元 44.035元
qwen3-max-2026-01-23 非思考和思考模式 32K<Token≤128K 17.614元 88.071元
qwen3-max-2026-01-23 非思考和思考模式 128K<Token≤256K 22.018元 110.089元
qwen3-max-2025-09-23 仅非思考模式 0<Token≤32K 8.807元 44.035元
qwen3-max-2025-09-23 仅非思考模式 32K<Token≤128K 17.614元 88.071元
qwen3-max-2025-09-23 仅非思考模式 128K<Token≤256K 22.018元 110.089元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 8.807元 44.035元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 17.614元 88.071元
qwen3-max-preview > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 22.018元 110.089元

更多模型

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen-max > Batch调用半价 仅非思考模式 无阶梯计价 11.743元 46.971元
qwen-max-latest 仅非思考模式 无阶梯计价 11.743元 46.971元
qwen-max-2025-01-25 仅非思考模式 无阶梯计价 11.743元 46.971元

4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

说明:欧盟部署范围下的模型无免费额度。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-max 非思考和思考模式 0<Token≤32K 8.993元 44.965元
qwen3-max 非思考和思考模式 32K<Token≤128K 17.986元 89.93元
qwen3-max 非思考和思考模式 128K<Token≤256K 22.483元 112.413元
qwen3-max-2026-01-23 非思考和思考模式 0<Token≤32K 8.993元 44.965元
qwen3-max-2026-01-23 非思考和思考模式 32K<Token≤128K 17.986元 89.93元
qwen3-max-2026-01-23 非思考和思考模式 128K<Token≤256K 22.483元 112.413元

2.2 千问Plus

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答)输出单价(每百万Token)
qwen3.6-plus 0<Token≤256K 2元 12元 12元
qwen3.6-plus 256K<Token≤1M 8元 48元 48元
qwen3.6-plus-2026-04-02 0<Token≤256K 2元 12元 12元
qwen3.6-plus-2026-04-02 256K<Token≤1M 8元 48元 48元
qwen3.5-plus 0<Token≤128K 0.8元 4.8元 4.8元
qwen3.5-plus 128K<Token≤256K 2元 12元 12元
qwen3.5-plus 256K<Token≤1M 4元 24元 24元
qwen3.5-plus-2026-04-20 0<Token≤128K 0.8元 4.8元 4.8元
qwen3.5-plus-2026-04-20 128K<Token≤256K 2元 12元 12元
qwen3.5-plus-2026-04-20 256K<Token≤1M 4元 24元 24元
qwen3.5-plus-2026-02-15 0<Token≤128K 0.8元 4.8元 4.8元
qwen3.5-plus-2026-02-15 128K<Token≤256K 2元 12元 12元
qwen3.5-plus-2026-02-15 256K<Token≤1M 4元 24元 24元
qwen-plus > Batch调用半价 0<Token≤128K 0.8元 2元 8元
qwen-plus > Batch调用半价 128K<Token≤256K 2.4元 20元 24元
qwen-plus > Batch调用半价 256K<Token≤1M 4.8元 48元 64元
qwen-plus-latest > Batch调用半价 0<Token≤128K 0.8元 2元 8元
qwen-plus-latest > Batch调用半价 128K<Token≤256K 2.4元 20元 24元
qwen-plus-latest > Batch调用半价 256K<Token≤1M 4.8元 48元 64元
qwen-plus-2025-12-01 0<Token≤128K 0.8元 2元 8元
qwen-plus-2025-12-01 128K<Token≤256K 2.4元 20元 24元
qwen-plus-2025-12-01 256K<Token≤1M 4.8元 48元 64元
qwen-plus-2025-09-11 0<Token≤128K 0.8元 2元 8元
qwen-plus-2025-09-11 128K<Token≤256K 2.4元 20元 24元
qwen-plus-2025-09-11 256K<Token≤1M 4.8元 48元 64元
qwen-plus-2025-07-28 0<Token≤128K 0.8元 2元 8元
qwen-plus-2025-07-28 128K<Token≤256K 2.4元 20元 24元
qwen-plus-2025-07-28 256K<Token≤1M 4.8元 48元 64元
qwen-plus-2025-07-14 无阶梯计价 0.8元 2元 8元
qwen-plus-2025-04-28 无阶梯计价 0.8元 2元 8元

更多模型

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 输出单价(每百万Token)
qwen-plus-2025-01-25 无阶梯计价 0.8元 2元
qwen-plus-2025-01-12 无阶梯计价 0.8元 2元
qwen-plus-2024-12-20 无阶梯计价 0.8元 2元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

说明:全球部署范围下的模型无免费额度。

模型名称 单次请求的输入Token范围 输入单价 (每百万Token) 非思考模式 输出单价 (每百万Token) 思考模式(思维链+回答)输出单价 (每百万Token)
qwen3.6-plus 0<Token≤256K 2元 12元 12元
qwen3.6-plus 256K<Token≤1M 8元 48元 48元
qwen3.6-plus-2026-04-02 0<Token≤256K 2元 12元 12元
qwen3.6-plus-2026-04-02 256K<Token≤1M 8元 48元 48元
qwen3.5-plus 0<Token≤128K 0.8元 4.8元 4.8元
qwen3.5-plus 128K<Token≤256K 2元 12元 12元
qwen3.5-plus 256K<Token≤1M 4元 24元 24元
qwen3.5-plus-2026-02-15 0<Token≤128K 0.8元 4.8元 4.8元
qwen3.5-plus-2026-02-15 128K<Token≤256K 2元 12元 12元
qwen3.5-plus-2026-02-15 256K<Token≤1M 4元 24元 24元
qwen-plus 0<Token≤128K 0.8元 2元 8元
qwen-plus 128K<Token≤256K 2.4元 20元 24元
qwen-plus 256K<Token≤1M 4.8元 48元 64元
qwen-plus-2025-12-01 0<Token≤128K 0.8元 2元 8元
qwen-plus-2025-12-01 128K<Token≤256K 2.4元 20元 24元
qwen-plus-2025-12-01 256K<Token≤1M 4.8元 48元 64元
qwen-plus-2025-09-11 0<Token≤128K 0.8元 2元 8元
qwen-plus-2025-09-11 128K<Token≤256K 2.4元 20元 24元
qwen-plus-2025-09-11 256K<Token≤1M 4.8元 48元 64元
qwen-plus-2025-07-28 0<Token≤128K 0.8元 2元 8元
qwen-plus-2025-07-28 128K<Token≤256K 2.4元 20元 24元
qwen-plus-2025-07-28 256K<Token≤1M 4.8元 48元 64元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际部署范围下的模型无免费额度。

模型名称 单次请求的输入Token范围 输入单价 (每百万Token) 非思考模式 输出单价 (每百万Token) 思考模式(思维链+回答)输出单价 (每百万Token)
qwen3.6-plus 0<Token≤256K 3.7471元 22.4826元 22.4826元
qwen3.6-plus 256K<Token≤1M 14.9884元 44.965元 44.965元
qwen3.6-plus-2026-04-02 0<Token≤256K 3.7471元 22.4826元 22.4826元
qwen3.6-plus-2026-04-02 256K<Token≤1M 14.9884元 44.965元 44.965元
qwen3.5-plus 0<Token≤256K 2.936元 17.614元 17.614元
qwen3.5-plus 256K<Token≤1M 3.67元 22.018元 22.018元
qwen3.5-plus-2026-04-20 0<Token≤256K 2.936元 17.614元 17.614元
qwen3.5-plus-2026-04-20 256K<Token≤1M 3.67元 22.018元 22.018元
qwen3.5-plus-2026-02-15 0<Token≤256K 2.936元 17.614元 17.614元
qwen3.5-plus-2026-02-15 256K<Token≤1M 3.67元 22.018元 22.018元
qwen-plus 0<Token≤256K 2.936元 8.807元 29.357元
qwen-plus 256K<Token≤1M 8.807元 26.421元 88.071元
qwen-plus-latest 0<Token≤256K 2.936元 8.807元 29.357元
qwen-plus-latest 256K<Token≤1M 8.807元 26.421元 88.071元
qwen-plus-2025-12-01 0<Token≤256K 2.936元 8.807元 29.357元
qwen-plus-2025-12-01 256K<Token≤1M 8.807元 26.421元 88.071元
qwen-plus-2025-09-11 0<Token≤256K 2.936元 8.807元 29.357元
qwen-plus-2025-09-11 256K<Token≤1M 8.807元 26.421元 88.071元
qwen-plus-2025-07-28 0<Token≤256K 2.936元 8.807元 29.357元
qwen-plus-2025-07-28 256K<Token≤1M 8.807元 26.421元 88.071元
qwen-plus-2025-07-14 无阶梯计价 2.936元 8.807元 29.357元
qwen-plus-2025-04-28 无阶梯计价 2.936元 8.807元 29.357元

4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

说明:美国部署范围下的模型无免费额度。

模型名称 单次请求的输入Token范围 输入单价 (每百万Token) 非思考模式 输出单价 (每百万Token) 思考模式(思维链+回答)输出单价 (每百万Token)
qwen-plus-us > 上下文缓存享有折扣 0<Token≤256K 2.936元 8.807元 29.357元
qwen-plus-us > 上下文缓存享有折扣 256K<Token≤1M 8.807元 26.421元 88.071元
qwen-plus-2025-12-01-us 0<Token≤256K 2.936元 8.807元 29.357元
qwen-plus-2025-12-01-us 256K<Token≤1M 8.807元 26.421元 88.071元

5. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

说明:欧盟部署范围下的模型无免费额度。

模型名称 单次请求的输入Token范围 输入单价 (每百万Token) 非思考模式 输出单价 (每百万Token) 思考模式(思维链+回答)输出单价 (每百万Token)
qwen-plus 0<Token≤256K 2.998元 8.993元 29.977元
qwen-plus 256K<Token≤1M 8.993元 26.979元 89.93元
qwen-plus-2025-12-01 0<Token≤256K 2.998元 8.993元 29.977元
qwen-plus-2025-12-01 256K<Token≤1M 8.993元 26.979元 89.93元

2.3 千问Flash

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费;若模型支持上下文缓存,仅输入Token享有折扣。两者不能同时生效。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤256K 1.2元 7.2元
qwen3.6-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 4.8元 28.8元
qwen3.6-flash-2026-04-16 非思考和思考模式 0<Token≤256K 1.2元 7.2元
qwen3.6-flash-2026-04-16 非思考和思考模式 256K<Token≤1M 4.8元 28.8元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤128K 0.2元 2元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.8元 8元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 1.2元 12元
qwen3.5-flash-2026-02-23 非思考和思考模式 0<Token≤128K 0.2元 2元
qwen3.5-flash-2026-02-23 非思考和思考模式 128K<Token≤256K 0.8元 8元
qwen3.5-flash-2026-02-23 非思考和思考模式 256K<Token≤1M 1.2元 12元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤128K 0.15元 1.5元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.6元 6元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 1.2元 12元
qwen-flash-2025-07-28 非思考和思考模式 0<Token≤128K 0.15元 1.5元
qwen-flash-2025-07-28 非思考和思考模式 128K<Token≤256K 0.6元 6元
qwen-flash-2025-07-28 非思考和思考模式 256K<Token≤1M 1.2元 12元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

说明:全球部署范围下的模型无免费额度。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3.6-flash > 上下文缓存享有折扣 非思考和思考模式 0<Token≤256K 1.2元 7.2元
qwen3.6-flash > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 4.8元 28.8元
qwen3.6-flash-2026-04-16 非思考和思考模式 0<Token≤256K 1.2元 7.2元
qwen3.6-flash-2026-04-16 非思考和思考模式 256K<Token≤1M 4.8元 28.8元
qwen3.5-flash > 上下文缓存享有折扣 非思考和思考模式 0<Token≤128K 0.2元 2元
qwen3.5-flash > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.8元 8元
qwen3.5-flash > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 1.2元 12元
qwen3.5-flash-2026-02-23 非思考和思考模式 0<Token≤128K 0.2元 2元
qwen3.5-flash-2026-02-23 非思考和思考模式 128K<Token≤256K 0.8元 8元
qwen3.5-flash-2026-02-23 非思考和思考模式 256K<Token≤1M 1.2元 12元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤128K 0.15元 1.5元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.6元 6元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 1.2元 12元
qwen-flash-2025-07-28 非思考和思考模式 0<Token≤128K 0.15元 1.5元
qwen-flash-2025-07-28 非思考和思考模式 128K<Token≤256K 0.6元 6元
qwen-flash-2025-07-28 非思考和思考模式 256K<Token≤1M 1.2元 12元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际部署范围下的模型无免费额度。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3.6-flash > 上下文缓存享有折扣 非思考和思考模式 0<Token≤256K 1.87355元 11.2413元
qwen3.6-flash > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 7.4942元 29.9758元
qwen3.6-flash-2026-04-16 非思考和思考模式 0<Token≤256K 1.87355元 11.2413元
qwen3.6-flash-2026-04-16 非思考和思考模式 256K<Token≤1M 7.4942元 29.9758元
qwen3.5-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤1M 0.734元 2.936元
qwen3.5-flash-2026-02-23 非思考和思考模式 0<Token≤1M 0.734元 2.936元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤256K 0.367元 2.936元
qwen-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 256K<Token≤1M 1.835元 14.678元
qwen-flash-2025-07-28 非思考和思考模式 0<Token≤256K 0.367元 2.936元
qwen-flash-2025-07-28 非思考和思考模式 256K<Token≤1M 1.835元 14.678元

4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

说明:美国部署范围下的模型无免费额度。

模型名称 单次请求的输入Token范围 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen-flash-us > 上下文缓存享有折扣 0<Token≤256K 0.367元 2.936元
qwen-flash-us > 上下文缓存享有折扣 256K<Token≤1M 1.835元 14.678元
qwen-flash-2025-07-28-us 0<Token≤256K 0.367元 2.936元
qwen-flash-2025-07-28-us 256K<Token≤1M 1.835元 14.678元

5. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

说明:欧盟部署范围下的模型无免费额度。

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3.5-flash 非思考和思考模式 0.749元 2.998元
qwen3.5-flash-2026-02-23 非思考和思考模式 0.749元 2.998元

2.4 千问Turbo

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答) 输出单价(每百万Token)
qwen-turbo > Batch调用半价 非思考和思考模式 0.3元 0.6元 3元
qwen-turbo-latest > Batch调用半价 非思考和思考模式 0.3元 0.6元 3元
qwen-turbo-2025-07-15 非思考和思考模式 0.3元 0.6元 3元
qwen-turbo-2025-04-28 非思考和思考模式 0.3元 0.6元 3元

更多模型

模型名称 输入单价(每百万Token) 输出单价(每百万Token) 免费额度有效期:百炼开通后90天内
qwen-turbo-2025-02-11 0.3元 0.6元 100万Token
qwen-turbo-2024-11-01 0.3元 0.6元 1000万Token

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 模式 输入单价 (每百万Token) 非思考模式 输出单价 (每百万Token) 思考模式(思维链+回答) 输出单价 (每百万Token)
qwen-turbo > Batch调用半价 非思考和思考 0.367元 1.468元 3.67元
qwen-turbo-latest 非思考和思考 0.367元 1.468元 3.67元
qwen-turbo-2025-04-28 非思考和思考 0.367元 1.468元 3.67元

更多模型

模型名称 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen-turbo-2024-11-01 0.367元 1.468元

2.5 QwQ

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token)
qwq-plus > Batch调用半价 仅思考模式 1.6元 4元
qwq-plus-latest 仅思考模式 1.6元 4元
qwq-plus-2025-03-05 仅思考模式 1.6元 4元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 模式 输入单价 (每百万Token) 输出单价 (每百万Token)
qwq-plus 仅思考模式 5.871元 17.614元

2.6 千问Long

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen-long > Batch调用半价 0.5元 2元
qwen-long-latest 0.5元 2元
qwen-long-2025-01-25 0.5元 2元

2.7 千问Omni

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 文本/图片/视频 输入单价(每百万Token) 音频 输入单价(每百万Token) 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus 7元 53元 40元 213元
qwen3.5-omni-plus-2026-03-15 7元 53元 40元 213元
qwen3.5-omni-flash 2.2元 18元 13.3元 72元
qwen3.5-omni-flash-2026-03-15 2.2元 18元 13.3元 72元

更多模型

模型名称 模式 文本 输入单价(每百万Token) 音频 输入单价(每百万Token) 图片/视频 输入单价(每百万Token) 文本 > 仅纯文本输入 输出单价(每百万Token) 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3-omni-flash 非思考和思考模式 1.8元 15.8元 3.3元 6.9元 12.7元 62.6元
qwen3-omni-flash-2025-12-01 非思考和思考模式 1.8元 15.8元 3.3元 6.9元 12.7元 62.6元
qwen3-omni-flash-2025-09-15 非思考和思考模式 1.8元 15.8元 3.3元 6.9元 12.7元 62.6元
qwen-omni-turbo 非思考模式 0.4元 25元 1.5元 1.6元 4.5元 50元
qwen-omni-turbo-latest 非思考模式 0.4元 25元 1.5元 1.6元 4.5元 50元
qwen-omni-turbo-2025-03-26 非思考模式 0.4元 25元 1.5元 1.6元 4.5元 50元
qwen-omni-turbo-2025-01-19 非思考模式 0.4元 25元 1.5元 1.6元 4.5元 50元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 文本/图片/视频 输入单价(每百万Token) 音频 输入单价(每百万Token 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus 10.49元 82.44元 62.2元 329.74元
qwen3.5-omni-plus-2026-03-15 10.49元 82.44元 62.2元 329.74元
qwen3.5-omni-flash 3元 22.48元 16.49元 89.18元
qwen3.5-omni-flash-2026-03-15 3元 22.48元 16.49元 89.18元

更多模型

模型名称 模式 文本 输入单价(每百万Token) 音频 输入单价(每百万Token) 图片/视频 输入单价(每百万Token) 文本>仅纯文本输入 输出单价(每百万Token) 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3-omni-flash 非思考和思考模式 3.156元 27.962元 5.725元 12.183元 22.458元 110.896元
qwen3-omni-flash-2025-12-01 非思考和思考模式 3.156元 27.962元 5.725元 12.183元 22.458元 110.896元
qwen3-omni-flash-2025-09-15 非思考和思考模式 3.156元 27.962元 5.725元 12.183元 22.458元 110.896元
qwen-omni-turbo 非思考模式 0.514元 32.586元 1.541元 1.982元 4.624元 65.246元
qwen-omni-turbo-latest 非思考模式 0.514元 32.586元 1.541元 1.982元 4.624元 65.246元
qwen-omni-turbo-2025-03-26 非思考模式 0.514元 32.586元 1.541元 1.982元 4.624元 65.246元

2.8 千问Omni-Realtime

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 文本/图片 输入单价(每百万Token) 音频 输入单价(每百万Token) 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus-realtime 10元 80元 60元 300元
qwen3.5-omni-plus-realtime-2026-03-15 10元 80元 60元 300元
qwen3.5-omni-flash-realtime 3.3元 27元 20元 107元
qwen3.5-omni-flash-realtime-2026-03-15 3.3元 27元 20元 107元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 文本/图片 输入单价(每百万Token) 音频 输入单价(每百万Token) 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen3.5-omni-plus-realtime 15.74元 123.65元 92.93元 464.64元
qwen3.5-omni-plus-realtime-2026-03-15 15.74元 123.65元 92.93元 464.64元
qwen3.5-omni-flash-realtime 4.12元 33.72元 24.73元 132.65元
qwen3.5-omni-flash-realtime-2026-03-15 4.12元 33.72元 24.73元 132.65元

2.9 QVQ

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qvq-max 8元 32元
qvq-max-latest 8元 32元
qvq-max-2025-05-15 8元 32元
qvq-max-2025-03-25 8元 32元
qvq-plus 2元 5元
qvq-plus-latest 2元 5元
qvq-plus-2025-05-15 2元 5元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 输入单价 (每百万Token) 输出单价 (每百万Token)
qvq-max 8.807元 35.228元
qvq-max-latest 8.807元 35.228元
qvq-max-2025-03-25 8.807元 35.228元

2.10 千问VL

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 1元 10元
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 1.5元 15元
qwen3-vl-plus > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 3元 30元
qwen3-vl-plus-2025-12-19 非思考和思考模式 0<Token≤32K 1元 10元
qwen3-vl-plus-2025-12-19 非思考和思考模式 32K<Token≤128K 1.5元 15元
qwen3-vl-plus-2025-12-19 非思考和思考模式 128K<Token≤256K 3元 30元
qwen3-vl-plus-2025-09-23 非思考和思考模式 0<Token≤32K 1元 10元
qwen3-vl-plus-2025-09-23 非思考和思考模式 32K<Token≤128K 1.5元 15元
qwen3-vl-plus-2025-09-23 非思考和思考模式 128K<Token≤256K 3元 30元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 0.15元 1.5元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 0.3元 3元
qwen3-vl-flash > Batch调用半价 > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.6元 6元
qwen3-vl-flash-2026-01-22 非思考和思考模式 0<Token≤32K 0.15元 1.5元
qwen3-vl-flash-2026-01-22 非思考和思考模式 32K<Token≤128K 0.3元 3元
qwen3-vl-flash-2026-01-22 非思考和思考模式 128K<Token≤256K 0.6元 6元
qwen3-vl-flash-2025-10-15 非思考和思考模式 0<Token≤32K 0.15元 1.5元
qwen3-vl-flash-2025-10-15 非思考和思考模式 32K<Token≤128K 0.3元 3元
qwen3-vl-flash-2025-10-15 非思考和思考模式 128K<Token≤256K 0.6元 6元

更多模型

模型名称 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen-vl-max > Batch调用半价 > 上下文缓存享有折扣 无阶梯计价 1.6元 4元
qwen-vl-max-latest > Batch调用半价 无阶梯计价 1.6元 4元
qwen-vl-max-2025-08-13 无阶梯计价 1.6元 4元
qwen-vl-max-2025-04-08 无阶梯计价 3元 9元
qwen-vl-max-2025-04-02 无阶梯计价 3元 9元
qwen-vl-max-2025-01-25 无阶梯计价 3元 9元
qwen-vl-max-2024-12-30 无阶梯计价 3元 9元
qwen-vl-max-2024-11-19 无阶梯计价 3元 9元
qwen-vl-plus > Batch调用半价 > 上下文缓存享有折扣 无阶梯计价 0.8元 2元
qwen-vl-plus-latest > Batch调用半价 无阶梯计价 0.8元 2元
qwen-vl-plus-2025-08-15 无阶梯计价 0.8元 2元
qwen-vl-plus-2025-07-10 无阶梯计价 0.15元 1.5元
qwen-vl-plus-2025-05-07 无阶梯计价 1.5元 4.5元
qwen-vl-plus-2025-01-25 无阶梯计价 1.5元 4.5元
qwen-vl-plus-2025-01-02 无阶梯计价 1.5元 4.5元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-vl-plus > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 1元 10元
qwen3-vl-plus > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 1.5元 15元
qwen3-vl-plus > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 3元 30元
qwen3-vl-plus-2025-09-23 非思考和思考模式 0<Token≤32K 1元 10元
qwen3-vl-plus-2025-09-23 非思考和思考模式 32K<Token≤128K 1.5元 15元
qwen3-vl-plus-2025-09-23 非思考和思考模式 128K<Token≤256K 3元 30元
qwen3-vl-flash > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 0.15元 1.5元
qwen3-vl-flash > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 0.3元 3元
qwen3-vl-flash > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.6元 6元
qwen3-vl-flash-2025-10-15 非思考和思考模式 0<Token≤32K 0.15元 1.5元
qwen3-vl-flash-2025-10-15 非思考和思考模式 32K<Token≤128K 0.3元 3元
qwen3-vl-flash-2025-10-15 非思考和思考模式 128K<Token≤256K 0.6元 6元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 模式 单次请求的输入Token数 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen3-vl-plus > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 1.468元 11.743元
qwen3-vl-plus > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 2.202元 17.614元
qwen3-vl-plus > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 4.404元 35.228元
qwen3-vl-plus-2025-12-19 非思考和思考模式 0<Token≤32K 1.468元 11.743元
qwen3-vl-plus-2025-12-19 非思考和思考模式 32K<Token≤128K 2.202元 17.614元
qwen3-vl-plus-2025-12-19 非思考和思考模式 128K<Token≤256K 4.404元 35.228元
qwen3-vl-plus-2025-09-23 非思考和思考模式 0<Token≤32K 1.468元 11.743元
qwen3-vl-plus-2025-09-23 非思考和思考模式 32K<Token≤128K 2.202元 17.614元
qwen3-vl-plus-2025-09-23 非思考和思考模式 128K<Token≤256K 4.404元 35.228元
qwen3-vl-flash > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 0.367元 2.936元
qwen3-vl-flash > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 0.55元 4.404元
qwen3-vl-flash > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.881元 7.046元
qwen3-vl-flash-2026-01-22 非思考和思考模式 0<Token≤32K 0.367元 2.936元
qwen3-vl-flash-2026-01-22 非思考和思考模式 32K<Token≤128K 0.55元 4.404元
qwen3-vl-flash-2026-01-22 非思考和思考模式 128K<Token≤256K 0.881元 7.046元
qwen3-vl-flash-2025-10-15 非思考和思考模式 0<Token≤32K 0.367元 2.936元
qwen3-vl-flash-2025-10-15 非思考和思考模式 32K<Token≤128K 0.55元 4.404元
qwen3-vl-flash-2025-10-15 非思考和思考模式 128K<Token≤256K 0.881元 7.046元

更多模型

模型名称 单次请求的输入Token数 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen-vl-max > 上下文缓存享有折扣 无阶梯计价 5.871元 23.486元
qwen-vl-max-latest 无阶梯计价 5.871元 23.486元
qwen-vl-max-2025-08-13 无阶梯计价 5.871元 23.486元
qwen-vl-max-2025-04-08 无阶梯计价 5.871元 23.486元
qwen-vl-plus > 上下文缓存享有折扣 无阶梯计价 1.541元 4.624元
qwen-vl-plus-latest 无阶梯计价 1.541元 4.624元
qwen-vl-plus-2025-08-15 无阶梯计价 1.541元 4.624元
qwen-vl-plus-2025-05-07 无阶梯计价 1.541元 4.624元
qwen-vl-plus-2025-01-25 无阶梯计价 1.541元 4.624元

4. 美国
服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-vl-flash-us > 上下文缓存享有折扣 非思考和思考模式 0<Token≤32K 0.367元 2.936元
qwen3-vl-flash-us > 上下文缓存享有折扣 非思考和思考模式 32K<Token≤128K 0.55元 4.404元
qwen3-vl-flash-us > 上下文缓存享有折扣 非思考和思考模式 128K<Token≤256K 0.881元 7.046元
qwen3-vl-flash-2025-10-15-us 非思考和思考模式 0<Token≤32K 0.367元 2.936元
qwen3-vl-flash-2025-10-15-us 非思考和思考模式 32K<Token≤128K 0.55元 4.404元
qwen3-vl-flash-2025-10-15-us 非思考和思考模式 128K<Token≤256K 0.881元 7.046元

4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-vl-plus 非思考和思考模式 0<Token≤32K 1.499元 11.991元
qwen3-vl-plus 非思考和思考模式 32K<Token≤128K 2.248元 17.986元
qwen3-vl-plus 非思考和思考模式 128K<Token≤256K 4.497元 35.972元
qwen3-vl-flash 非思考和思考模式 0<Token≤32K 0.375元 2.998元
qwen3-vl-flash 非思考和思考模式 32K<Token≤128K 0.562元 4.497元
qwen3-vl-flash 非思考和思考模式 128K<Token≤256K 0.899元 7.194元
qwen3-vl-flash-2025-10-15 非思考和思考模式 0<Token≤32K 0.375元 2.998元
qwen3-vl-flash-2025-10-15 非思考和思考模式 32K<Token≤128K 0.562元 4.497元
qwen3-vl-flash-2025-10-15 非思考和思考模式 128K<Token≤256K 0.899元 7.194元

2.11 千问OCR

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen-vl-ocr > Batch调用半价 0.3元 0.5元
qwen-vl-ocr-latest > Batch调用半价 0.3元 0.5元
qwen-vl-ocr-2025-11-20 0.3元 0.5元
qwen-vl-ocr-2025-08-28 5元 5元
qwen-vl-ocr-2025-04-13 5元 5元
qwen-vl-ocr-2024-10-28 5元 5元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen-vl-ocr 0.3元 0.5元
qwen-vl-ocr-2025-11-20 0.3元 0.5元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen-vl-ocr 0.514元 1.174元
qwen-vl-ocr-2025-11-20 0.514元 1.174元

2.12 千问Audio

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。
计费规则:按输入Token和输出Token计费。
音频Token计算规则:每一秒钟的音频对应25个Token。若音频时长不足1秒,则按25个Token计算。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) 免费额度
qwen-audio-turbo 目前仅供免费体验。 免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型 各10万Token 有效期:阿里云百炼开通后90天内
qwen-audio-turbo-latest 目前仅供免费体验。 免费额度用完后不可调用,推荐使用全模态(Qwen-Omni)作为替代模型 各10万Token 有效期:阿里云百炼开通后90天内

2.13 千问数学模型

计费规则:按输入Token和输出Token计费。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) 免费额度
qwen-math-plus 4元 12元 各100万Token 有效期:阿里云百炼开通后90天内
qwen-math-turbo 2元 6元 各100万Token 有效期:阿里云百炼开通后90天内

2.14 千问Coder

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持上下文缓存,仅输入Token享有折扣。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen3-coder-plus > 上下文缓存享有折扣 0<Token≤32K 4元 16元
qwen3-coder-plus > 上下文缓存享有折扣 32K<Token≤128K 6元 24元
qwen3-coder-plus > 上下文缓存享有折扣 128K<Token≤256K 10元 40元
qwen3-coder-plus > 上下文缓存享有折扣 256K<Token≤1M 20元 200元
qwen3-coder-plus-2025-09-23 0<Token≤32K 4元 16元
qwen3-coder-plus-2025-09-23 32K<Token≤128K 6元 24元
qwen3-coder-plus-2025-09-23 128K<Token≤256K 10元 40元
qwen3-coder-plus-2025-09-23 256K<Token≤1M 20元 200元
qwen3-coder-plus-2025-07-22 0<Token≤32K 4元 16元
qwen3-coder-plus-2025-07-22 32K<Token≤128K 6元 24元
qwen3-coder-plus-2025-07-22 128K<Token≤256K 10元 40元
qwen3-coder-plus-2025-07-22 256K<Token≤1M 20元 200元
qwen3-coder-flash 0<Token≤32K 1元 4元
qwen3-coder-flash 32K<Token≤128K 1.5元 6元
qwen3-coder-flash 128K<Token≤256K 2.5元 10元
qwen3-coder-flash 256K<Token≤1M 5元 25元
qwen3-coder-flash-2025-07-28 0<Token≤32K 1元 4元
qwen3-coder-flash-2025-07-28 32K<Token≤128K 1.5元 6元
qwen3-coder-flash-2025-07-28 128K<Token≤256K 2.5元 10元
qwen3-coder-flash-2025-07-28 256K<Token≤1M 5元 25元

更多模型

模型名称 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen-coder-plus 无阶梯计价 3.5元 7元
qwen-coder-plus-latest 无阶梯计价 3.5元 7元
qwen-coder-plus-2024-11-06 无阶梯计价 3.5元 7元
qwen-coder-turbo 无阶梯计价 2元 6元
qwen-coder-turbo-latest 无阶梯计价 2元 6元
qwen-coder-turbo-2024-09-19 无阶梯计价 2元 6元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 单次请求的输入Token数 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen3-coder-plus 0<Token≤32K 4元 16元
qwen3-coder-plus 32K<Token≤128K 6元 24元
qwen3-coder-plus 128K<Token≤256K 10元 40元
qwen3-coder-plus 256K<Token≤1M 20元 200元
qwen3-coder-plus-2025-09-23 0<Token≤32K 4元 16元
qwen3-coder-plus-2025-09-23 32K<Token≤128K 6元 24元
qwen3-coder-plus-2025-09-23 128K<Token≤256K 10元 40元
qwen3-coder-plus-2025-09-23 256K<Token≤1M 20元 200元
qwen3-coder-plus-2025-07-22 0<Token≤32K 4元 16元
qwen3-coder-plus-2025-07-22 32K<Token≤128K 6元 24元
qwen3-coder-plus-2025-07-22 128K<Token≤256K 10元 40元
qwen3-coder-plus-2025-07-22 256K<Token≤1M 20元 200元
qwen3-coder-flash 0<Token≤32K 1元 4元
qwen3-coder-flash 32K<Token≤128K 1.5元 6元
qwen3-coder-flash 128K<Token≤256K 2.5元 10元
qwen3-coder-flash 256K<Token≤1M 5元 25元
qwen3-coder-flash-2025-07-28 0<Token≤32K 1元 4元
qwen3-coder-flash-2025-07-28 32K<Token≤128K 1.5元 6元
qwen3-coder-flash-2025-07-28 128K<Token≤256K 2.5元 10元
qwen3-coder-flash-2025-07-28 256K<Token≤1M 5元 25元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 单次请求的输入Token数 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen3-coder-plus 0<Token≤32K 7.339元 36.696元
qwen3-coder-plus 32K<Token≤128K 13.211元 66.053元
qwen3-coder-plus 128K<Token≤256K 22.018元 110.089元
qwen3-coder-plus 256K<Token≤1M 44.035元 440.354元
qwen3-coder-plus-2025-09-23 0<Token≤32K 7.339元 36.696元
qwen3-coder-plus-2025-09-23 32K<Token≤128K 13.211元 66.053元
qwen3-coder-plus-2025-09-23 128K<Token≤256K 22.018元 110.089元
qwen3-coder-plus-2025-09-23 256K<Token≤1M 44.035元 440.354元
qwen3-coder-plus-2025-07-22 0<Token≤32K 7.339元 36.696元
qwen3-coder-plus-2025-07-22 32K<Token≤128K 13.211元 66.053元
qwen3-coder-plus-2025-07-22 128K<Token≤256K 22.018元 110.089元
qwen3-coder-plus-2025-07-22 256K<Token≤1M 44.035元 440.354元
qwen3-coder-flash 0<Token≤32K 2.202元 11.009元
qwen3-coder-flash 32K<Token≤128K 3.67元 18.348元
qwen3-coder-flash 128K<Token≤256K 5.871元 29.357元
qwen3-coder-flash 256K<Token≤1M 11.743元 70.457元
qwen3-coder-flash-2025-07-28 0<Token≤32K 2.202元 11.009元
qwen3-coder-flash-2025-07-28 32K<Token≤128K 3.67元 18.348元
qwen3-coder-flash-2025-07-28 128K<Token≤256K 5.871元 29.357元
qwen3-coder-flash-2025-07-28 256K<Token≤1M 11.743元 70.457元

2.15 千问翻译模型

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen-mt-plus 1.8元 5.4元
qwen-mt-flash 0.7元 1.95元
qwen-mt-lite 0.6元 1.6元
qwen-mt-turbo 0.7元 1.95元

2. 全球

服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen-mt-plus 1.8元 5.4元
qwen-mt-flash 0.7元 1.95元
qwen-mt-lite 0.6元 1.6元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen-mt-plus 18.055元 54.09元
qwen-mt-flash 1.174元 3.596元
qwen-mt-lite 0.881元 2.642元
qwen-mt-turbo 1.174元 3.596元

4. 美国

服务部署范围为美国时,模型推理计算资源仅限于美国境内;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)。

模型名称 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen-mt-lite-us 0.881元 2.642元

2.16 千问数据挖掘模型

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) 免费额度
qwen-doc-turbo 0.6元 1元 无免费额度

2.17 千问深入研究模型

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) 免费额度
qwen-deep-research 54元 163元 无免费额度

2.18 通义晓蜜对话分析模型

说明:服务部署范围仅支持中国内地。数据存储位于北京接入地域,模型推理计算资源仅限于中国内地。

计费规则:按输入Token和输出Token计费。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
tongyi-xiaomi-analysis-flash 0.2元 0.4元
tongyi-xiaomi-analysis-pro 1.0元 2.7元

3、文本生成-千问-开源版

3.1 Qwen3.6

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答)输出单价(每百万Token)
qwen3.6-35b-a3b 0<Token≤256K 1.8元 10.8元 10.8元
qwen3.6-27b 0<Token≤256K 3元 18元 18元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答) 输出单价(每百万Token)
非思考模式 思考模式(思维链+回答)
qwen3.6-35b-a3b 0<Token≤256K 1.8元 10.8元 10.8元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答)输出单价(每百万Token)
qwen3.6-35b-a3b 0<Token≤256K 2.810325元 16.86195元 16.86195元
qwen3.6-27b 0<Token≤256K 4.49652元 26.97912元 26.97912元

3.2 Qwen3.5

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答)输出单价(每百万Token)
qwen3.5-397b-a17b 0<Token≤128K 1.2元 7.2元 7.2元
qwen3.5-397b-a17b 128K<Token≤256K 3元 18元 18元
qwen3.5-122b-a10b 0<Token≤128K 0.8元 6.4元 6.4元
qwen3.5-122b-a10b 128K<Token≤256K 2元 16元 16元
qwen3.5-27b 0<Token≤128K 0.6元 4.8元 4.8元
qwen3.5-27b 128K<Token≤256K 1.8元 14.4元 14.4元
qwen3.5-35b-a3b 0<Token≤128K 0.4元 3.2元 3.2元
qwen3.5-35b-a3b 128K<Token≤256K 1.6元 12.8元 12.8元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答)输出单价(每百万Token)
qwen3.5-397b-a17b 0<Token≤128K 1.2元 7.2元 7.2元
qwen3.5-397b-a17b 128K<Token≤256K 3元 18元 18元
qwen3.5-122b-a10b 0<Token≤128K 0.8元 6.4元 6.4元
qwen3.5-122b-a10b 128K<Token≤256K 2元 16元 16元
qwen3.5-27b 0<Token≤128K 0.6元 4.8元 4.8元
qwen3.5-27b 128K<Token≤256K 1.8元 14.4元 14.4元
qwen3.5-35b-a3b 0<Token≤128K 0.4元 3.2元 3.2元
qwen3.5-35b-a3b 128K<Token≤256K 1.6元 12.8元 12.8元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 单次请求的输入Token范围 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答) 输出单价(每百万Token)
qwen3.5-397b-a17b 0<Token≤256K 4.404元 26.421元 26.421元
qwen3.5-122b-a10b 0<Token≤256K 2.936元 23.486元 23.486元
qwen3.5-27b 0<Token≤256K 2.202元 17.614元 17.614元
qwen3.5-35b-a3b 0<Token≤256K 1.835元 14.678元 14.678元

3.3 Qwen3

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答)输出单价(每百万Token)
qwen3-next-80b-a3b-thinking 仅思考模式 1元 \- 10元
qwen3-next-80b-a3b-instruct 仅非思考模式 1元 4元 \-
qwen3-235b-a22b-thinking-2507 仅思考模式 2元 \- 20元
qwen3-235b-a22b-instruct-2507 仅非思考模式 2元 8元 \-
qwen3-30b-a3b-thinking-2507 仅思考模式 0.75元 \- 7.5元
qwen3-30b-a3b-instruct-2507 仅非思考模式 0.75元 3元 \-
qwen3-235b-a22b 非思考和思考模式 2元 8元 20元
qwen3-32b 非思考和思考模式 2元 8元 20元
qwen3-30b-a3b 非思考和思考模式 0.75元 3元 7.5元
qwen3-14b 非思考和思考模式 1元 4元 10元
qwen3-8b 非思考和思考模式 0.5元 2元 5元
qwen3-4b 非思考和思考模式 0.3元 1.2元 3元
qwen3-1.7b 非思考和思考模式 0.3元 1.2元 3元
qwen3-0.6b 非思考和思考模式 0.3元 1.2元 3元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 模式 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答)输出单价(每百万Token)
qwen3-next-80b-a3b-thinking 仅思考模式 1元 \- 10元
qwen3-next-80b-a3b-instruct 仅非思考模式 1元 4元 \-
qwen3-235b-a22b-thinking-2507 仅思考模式 1.688元 \- 16.88元
qwen3-235b-a22b-instruct-2507 仅非思考模式 1.688元 6.752元 \-
qwen3-30b-a3b-thinking-2507 仅思考模式 0.75元 \- 7.5元
qwen3-30b-a3b-instruct-2507 仅非思考模式 0.75元 3元 \-
qwen3-235b-a22b 非思考和思考模式 2元 8元 20元
qwen3-32b 非思考和思考模式 1.174元 4.697元 4.697元
qwen3-30b-a3b 非思考和思考模式 0.75元 3元 7.5元
qwen3-14b 非思考和思考模式 1元 4元 10元
qwen3-8b 非思考和思考模式 0.5元 2元 5元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 模式 输入单价(每百万Token) 非思考模式 输出单价(每百万Token) 思考模式(思维链+回答) 输出单价(每百万Token)
qwen3-next-80b-a3b-thinking 仅思考模式 1.101元 \- 8.807元
qwen3-next-80b-a3b-instruct 仅非思考模式 1.101元 8.807元 \-
qwen3-235b-a22b-thinking-2507 仅思考模式 1.688元 \- 16.88元
qwen3-235b-a22b-instruct-2507 仅非思考模式 1.688元 6.752元 \-
qwen3-30b-a3b-thinking-2507 仅思考模式 1.468元 \- 17.614元
qwen3-30b-a3b-instruct-2507 仅非思考模式 1.468元 5.871元 \-
qwen3-235b-a22b 非思考和思考模式 5.137元 20.55元 61.65元
qwen3-32b 非思考和思考模式 1.174元 4.697元 4.697元
qwen3-30b-a3b 非思考和思考模式 1.468元 5.871元 17.614元
qwen3-14b 非思考和思考模式 2.569元 10.275元 30.825元
qwen3-8b 非思考和思考模式 1.321元 5.137元 15.412元
qwen3-4b 非思考和思考模式 0.807元 3.082元 9.247元
qwen3-1.7b 非思考和思考模式 0.807元 3.082元 9.247元
qwen3-0.6b 非思考和思考模式 0.807元 3.082元 9.247元

3.4 QwQ-开源版

计费规则:按输入Token和输出Token计费。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwq-32b 2元 6元

3.5 QwQ-Preview

计费规则:按输入Token和输出Token计费。

影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwq-32b-preview > Batch调用半价 2元 6元

3.6 Qwen2.5

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen2.5-14b-instruct-1m 1元 3元
qwen2.5-7b-instruct-1m 0.5元 1元
qwen2.5-72b-instruct 4元 12元
qwen2.5-32b-instruct 2元 6元
qwen2.5-14b-instruct 1元 3元
qwen2.5-7b-instruct 0.5元 1元
qwen2.5-3b-instruct 0.3元 0.9元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

说明:国际(新加坡)模型无免费额度。

模型名称 输入单价 (每百万Token) 输出单价 (每百万Token)
qwen2.5-14b-instruct-1m 5.908元 23.632元
qwen2.5-7b-instruct-1m 2.701元 10.789元
qwen2.5-72b-instruct 10.275元 41.1元
qwen2.5-32b-instruct 5.137元 20.55元
qwen2.5-14b-instruct 2.569元 10.275元
qwen2.5-7b-instruct 1.284元 5.137元

3.7 QVQ

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qvq-72b-preview 12元 36元

3.8 Qwen-Omni

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 文本 输入单价(每百万Token) 音频 输入单价(每百万Token) 图片/视频 输入单价(每百万Token) 文本 > 仅纯文本输入 输出单价(每百万Token) 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen2.5-omni-7b 0.6元 38元 2元 2.4元 6元 76元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 文本 输入单价(每百万Token) 音频 输入单价(每百万Token) 图片/视频 输入单价(每百万Token) 文本 > 仅纯文本输入 输出单价(每百万Token) 文本 > 多模态输入 输出单价(每百万Token) 文本+音频 > 仅音频计费 输出单价(每百万Token)
qwen2.5-omni-7b 0.734元 49.613元 2.055元 2.936元 6.165元 99.153元

3.9 Qwen3-Omni-Captioner

计费规则:按输入Token和输出Token计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen3-omni-30b-a3b-captioner 15.8元 12.7元

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen3-omni-30b-a3b-captioner 27.962元 22.458元

3.10 Qwen-VL

1.中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-vl-235b-a22b-thinking 仅思考模式 2元 20元
qwen3-vl-235b-a22b-instruct 仅非思考模式 2元 8元
qwen3-vl-32b-thinking 仅思考模式 2元 20元
qwen3-vl-32b-instruct 仅非思考模式 2元 8元
qwen3-vl-30b-a3b-thinking 仅思考模式 0.75元 7.5元
qwen3-vl-30b-a3b-instruct 仅非思考模式 0.75元 3元
qwen3-vl-8b-thinking 仅思考模式 0.5元 5元
qwen3-vl-8b-instruct 仅非思考模式 0.5元 2元

更多模型

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen2.5-vl-72b-instruct 16元 48元
qwen2.5-vl-32b-instruct 8元 24元
qwen2.5-vl-7b-instruct 2元 5元
qwen2.5-vl-3b-instruct 1.2元 3.6元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-vl-235b-a22b-thinking 仅思考模式 2元 20元
qwen3-vl-235b-a22b-instruct 仅非思考模式 2元 8元
qwen3-vl-32b-thinking 仅思考模式 1.174元 4.697元
qwen3-vl-32b-instruct 仅非思考模式 1.174元 4.697元
qwen3-vl-30b-a3b-thinking 仅思考模式 0.75元 7.5元
qwen3-vl-30b-a3b-instruct 仅非思考模式 0.75元 3元
qwen3-vl-8b-thinking 仅思考模式 0.5元 5元
qwen3-vl-8b-instruct 仅非思考模式 0.5元 2元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
qwen3-vl-235b-a22b-thinking 仅思考模式 2.936元 29.357元
qwen3-vl-235b-a22b-instruct 仅非思考模式 2.936元 11.743元
qwen3-vl-32b-thinking 仅思考模式 1.174元 4.697元
qwen3-vl-32b-instruct 仅非思考模式 1.174元 4.697元
qwen3-vl-30b-a3b-thinking 仅思考模式 1.468元 17.614元
qwen3-vl-30b-a3b-instruct 仅非思考模式 1.468元 5.871元
qwen3-vl-8b-thinking 仅思考模式 1.321元 15.412元
qwen3-vl-8b-instruct 仅非思考模式 1.321元 5.137元

3.12 Qwen-Math

模型名称 输入单价(每百万Token) 输出单价(每百万Token)
qwen2.5-math-72b-instruct 4元 12元
qwen2.5-math-7b-instruct 1元 2元

3.13 Qwen-Coder

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen3-coder-next 0<Token≤32K 1元 4元
qwen3-coder-next 32K<Token≤128K 1.5元 6元
qwen3-coder-next 128K<Token≤256K 2.5元 10元
qwen3-coder-480b-a35b-instruct 0<Token≤32K 6元 24元
qwen3-coder-480b-a35b-instruct 32K<Token≤128K 9元 36元
qwen3-coder-480b-a35b-instruct 128K<Token≤200K 15元 60元
qwen3-coder-30b-a3b-instruct 0<Token≤32K 1.5元 6元
qwen3-coder-30b-a3b-instruct 32K<Token≤128K 2.25元 9元
qwen3-coder-30b-a3b-instruct 128K<Token≤200K 3.75元 15元
qwen2.5-coder-32b-instruct 无阶梯计价 2元 6元
qwen2.5-coder-14b-instruct 无阶梯计价 2元 6元
qwen2.5-coder-7b-instruct 无阶梯计价 1元 2元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen3-coder-480b-a35b-instruct 0<Token≤32K 6元 24元
qwen3-coder-480b-a35b-instruct 32K<Token≤128K 9元 36元
qwen3-coder-480b-a35b-instruct 128K<Token≤200K 15元 60元
qwen3-coder-30b-a3b-instruct 0<Token≤32K 1.5元 6元
qwen3-coder-30b-a3b-instruct 32K<Token≤128K 2.25元 9元
qwen3-coder-30b-a3b-instruct 128K<Token≤200K 3.75元 15元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen3-coder-next 0<Token≤32K 2.202元 11.009元
qwen3-coder-next 32K<Token≤128K 3.67元 18.348元
qwen3-coder-next 128K<Token≤256K 5.871元 29.357元
qwen3-coder-480b-a35b-instruct 0<Token≤32K 11.009元 55.044元
qwen3-coder-480b-a35b-instruct 32K<Token≤128K 19.816元 99.08元
qwen3-coder-480b-a35b-instruct 128K<Token≤200K 33.027元 165.133元
qwen3-coder-30b-a3b-instruct 0<Token≤32K 3.303元 16.513元
qwen3-coder-30b-a3b-instruct 32K<Token≤128K 5.504元 27.522元
qwen3-coder-30b-a3b-instruct 128K<Token≤200K 8.807元 44.035元

4. 欧盟
服务部署范围为欧盟时,模型推理计算资源仅限于欧盟境内;静态数据存储于您所选的地域。该部署范围支持的地域:德国(法兰克福)。

模型名称 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token)
qwen3-coder-next 0<Token≤32K 2.248元 11.241元
qwen3-coder-next 32K<Token≤128K 3.747元 18.736元
qwen3-coder-next 128K<Token≤256K 5.995元 29.977元

4、文本生成-第三方模型

4.1 DeepSeek

计费规则:按输入Token和输出Token计费。
影响计费的因素:若模型支持Batch调用,其输入和输出Token单价均按实时推理价格的50%计费。

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
deepseek-v4-pro > 上下文缓存享有折扣 12元 24元
deepseek-v4-flash > 上下文缓存享有折扣 1元 2元
deepseek-v3.2 > 上下文缓存享有折扣 2元 3元
deepseek-v3.2-exp 2元 3元
deepseek-v3.1 4元 12元
deepseek-r1 > Batch调用半价 4元 16元
deepseek-r1-0528 4元 16元
deepseek-v3 > Batch调用半价 2元 8元
deepseek-r1-distill-qwen-1.5b 限时免费 限时免费
deepseek-r1-distill-qwen-7b 0.5元 1元
deepseek-r1-distill-qwen-14b 1元 3元
deepseek-r1-distill-qwen-32b 2元 6元
deepseek-r1-distill-llama-8b 限时免费 限时免费

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
deepseek-v4-pro > 上下文缓存享有折扣 12元 24元
deepseek-v4-flash > 上下文缓存享有折扣 1元 2元

3. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
deepseek-v3.2 > 上下文缓存享有折扣 4.272元 12.815元

4.2 DeepSeek-硅基流动

说明:服务部署范围仅支持中国内地。

模型名称 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
siliconflow/deepseek-v3.2 2元 3元
siliconflow/deepseek-v3.1-terminus 4元 12元
siliconflow/deepseek-r1-0528 4元 16元
siliconflow/deepseek-v3-0324 2元 8元

4.3 DeepSeek-快手万擎

模型名称 输入单价(每百万Token) 输出单价(每百万Token) > 思维链+回答
vanchin/deepseek-v3.2-think > 上下文缓存享有折扣 2元 3元
vanchin/deepseek-v3.1-terminus > 上下文缓存享有折扣 4元 12元
vanchin/deepseek-r1 > 上下文缓存享有折扣 4元 16元
vanchin/deepseek-v3 > 上下文缓存享有折扣 2元 8元
vanchin/deepseek-ocr 0.216元 0.216元

4.4 Kimi

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token)
kimi-k2.6 非思考和思考模式 6.5元 27元
kimi-k2.5 非思考和思考模式 4元 21元
kimi-k2-thinking 仅思考模式 4元 16元
Moonshot-Kimi-K2-Instruct 非思考模式 4元 16元

2. 全球
服务部署范围为全球时,模型推理计算资源在全球范围内动态调度;静态数据存储于您所选的地域。该部署范围支持的地域:美国(弗吉尼亚)、德国(法兰克福)。

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token)
kimi-k2.5 非思考和思考模式 4元 21元

4.5 Kimi-月之暗面

模型名称 输入单价(每百万Token) 输出单价(每百万Token) > 思维链和回答
kimi/kimi-k2.6 > 上下文缓存享有折扣 6.5元 27元
kimi/kimi-k2.5 > 上下文缓存享有折扣 4元 21元

4.6 GLM

模型名称 模式 单次请求的输入Token数 输入单价(每百万Token) 输出单价(每百万Token) > 思维链和回答
glm-5.1 非思考和思考模式 0<Token≤32K 6元 24元
glm-5.1 非思考和思考模式 32K<Token≤200K 8元 28元
glm-5 非思考和思考模式 0<Token≤32K 4元 18元
glm-5 非思考和思考模式 32K<Token≤198K 6元 22元
glm-4.7 非思考和思考模式 0<Token≤32K 3元 14元
glm-4.7 非思考和思考模式 32K<Token≤166K 4元 16元
glm-4.6 非思考和思考模式 0<Token≤32K 3元 14元
glm-4.6 非思考和思考模式 32K<Token≤166K 4元 16元
glm-4.5 非思考和思考模式 0<Token≤32K 3元 14元
glm-4.5 非思考和思考模式 32K<Token≤96K 4元 16元
glm-4.5-air 非思考和思考模式 0<Token≤32K 0.8元 6元
glm-4.5-air 非思考和思考模式 32K<Token≤96K 1.2元 8元

4.7 MiniMax

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token) > 思维链和回答
MiniMax-M2.5 仅思考模式 2.1元 8.4元
MiniMax-M2.1 仅思考模式 2.1元 8.4元

4.8 MiniMax-稀宇科技

模型名称 模式 输入单价(每百万Token) 输出单价(每百万Token) > 思维链和回答
MiniMax/MiniMax-M2.7 > 上下文缓存享有折扣 仅思考模式 2.1元 8.4元
MiniMax/MiniMax-M2.5 > 上下文缓存享有折扣 仅思考模型 2.1元 8.4元
MiniMax/MiniMax-M2.1 > 上下文缓存享有折扣 仅思考模式 2.1元 8.4元

5、图像生成

计费规则:输入不计费,输出计费。输出按成功生成的 图像张数 计费。
计费公式:费用 = 图像单价 × 输出的图像张数

计费说明:

  • 费用与输出图像的分辨率、宽高比无关。
  • 请求失败不产生任何费用,也不消耗免费额度。

计费示例:部分图像生成失败
假设图像单价为 0.10元/张。若您调用接口请求生成 4 张图像,但实际仅成功返回 3 张图像的 URL,另 1 张生成失败,系统将仅对成功生成的图像进行计费。

  • 计费数量:3 张。
  • 费用计算:0.1 × 3 = 0.3元。

5.1 千问文生图

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输出单价
qwen-image-2.0-pro 0.5元/张
qwen-image-2.0-pro-2026-04-22 0.5元/张
qwen-image-2.0-pro-2026-03-03 0.5元/张
qwen-image-2.0 0.2元/张
qwen-image-2.0-2026-03-03 0.2元/张
qwen-image-max 0.5元/张
qwen-image-max-2025-12-30 0.5元/张
qwen-image-plus 0.2元/张
qwen-image-plus-2026-01-09 0.2元/张
qwen-image 0.25元/张

2. 国际

模型名称 输出单价
qwen-image-2.0-pro 0.550443元/张
qwen-image-2.0-pro-2026-04-22 0.550443元/张
qwen-image-2.0-pro-2026-03-03 0.550443元/张
qwen-image-2.0 0.256873元/张
qwen-image-2.0-2026-03-03 0.256873元/张
qwen-image-max 0.550443元/张
qwen-image-max-2025-12-30 0.550443元/张
qwen-image-plus 0.220177元/张
qwen-image-plus-2026-01-09 0.220177元/张
qwen-image 0.256873元/张

5.2 千问图像编辑

1. 中国内地
服务部署范围为中国内地时,模型推理计算资源仅限于中国内地;静态数据存储于您所选的地域。该部署范围支持的地域:华北2(北京)。

模型名称 输出单价
qwen-image-2.0-pro 0.5元/张
qwen-image-2.0-pro-2026-04-22 0.5元/张
qwen-image-2.0-pro-2026-03-03 0.5元/张
qwen-image-2.0 0.2元/张
qwen-image-2.0-2026-03-03 0.2元/张
qwen-image-edit-max 0.5元/张
qwen-image-edit-max-2026-01-16 0.5元/张
qwen-image-edit-plus 0.2元/张
qwen-image-edit-plus-2025-12-15 0.2元/张
qwen-image-edit-plus-2025-10-30 0.2元/张
qwen-image-edit 0.3元/张

2. 国际

模型名称 输出单价
qwen-image-2.0-pro 0.550443元/张
qwen-image-2.0-pro-2026-04-22 0.550443元/张
qwen-image-2.0-pro-2026-03-03 0.550443元/张
qwen-image-2.0 0.256873元/张
qwen-image-2.0-2026-03-03 0.256873元/张
qwen-image-edit-max 0.550443元/张
qwen-image-edit-max-2026-01-16 0.550443元/张
qwen-image-edit-plus 0.220177元/张
qwen-image-edit-plus-2025-12-15 0.220177元/张
qwen-image-edit-plus-2025-10-30 0.220177元/张
qwen-image-edit 0.330266元/张

5.3 千问图像翻译

模型名称 输出单价
qwen-mt-image 0.003元/张

5.4 Z-Image

1. 中国内地

模型名称 输出单价
z-image-turbo 关闭提示词改写(prompt_extend=false):0.1元/张 开启提示词改写(prompt_extend=true):0.2元/张

2. 国际
服务部署范围为国际时,模型推理计算资源在全球范围内动态调度(不含中国内地);静态数据存储于您所选的地域。该部署范围支持的地域:新加坡。

模型名称 输出单价
z-image-turbo 关闭提示词改写(prompt_extend=false):0.110089元/张 开启提示词改写(prompt_extend=true):0.220177元/张

5.5 万相文生图

1. 中国内地

模型名称 输出单价
wan2.6-t2i 0.20元/张
wan2.5-t2i-preview 0.20元/张
wan2.2-t2i-plus 0.20元/张
wan2.2-t2i-flash 0.14元/张
wanx2.1-t2i-plus 0.20元/张
wanx2.1-t2i-turbo 0.14元/张
wanx2.0-t2i-turbo 0.04元/张
wanx-v1 0.16元/张

2. 全球

模型名称 输出单价
wan2.6-t2i 0.20元/张

3. 国际

模型名称 输出单价
wan2.6-t2i 0.220177元/张
wan2.5-t2i-preview 0.220177元/张
wan2.2-t2i-plus 0.366962元/张
wan2.2-t2i-flash 0.183481元/张
wan2.1-t2i-plus 0.366962元/张
wan2.1-t2i-turbo 0.183481元/张

5.6 万相图像生成与编辑

1. 中国内地

模型名称 输出单价
wan2.7-image-pro 0.50元/张
wan2.7-image 0.20元/张
wan2.6-image 0.20元/张

2. 全球

模型名称 输出单价
wan2.6-image 0.20元/张

3. 国际

模型名称 输出单价
wan2.7-image-pro 0.562065元/张
wan2.7-image 0.220177元/张
wan2.6-image 0.220177元/张

5.7 万相通用图像编辑

1. 中国内地

模型名称 输出单价
wan2.5-i2i-preview 0.20元/张 50张
wanx2.1-imageedit 0.14元/张 500张

2. 国际

模型名称 输出单价
wan2.5-i2i-preview 0.220177元/张

5.8 万相涂鸦作画

模型名称 输出单价
wanx-sketch-to-image-lite 0.06元/张

5.9 万相图像局部重绘

模型名称 输出单价
wanx-x-painting 目前仅供免费体验。 > 免费额度用完后不可调用

5.10 人像风格重绘

模型名称 输出单价
wanx-style-repaint-v1 0.12元/张

5.11 图像背景生成

模型名称 输出单价
wanx-background-generation-v2 0.08元/张

5.12 图像画面扩展

模型名称 输出单价
image-out-painting 0.18元/张

5.13 人物实例分割

模型名称 输出单价
image-instance-segmentation 目前仅供免费体验。 > 免费额度用完后不可调用。

5.14 图像擦除补全

模型名称 输出单价
image-erase-completion 目前仅供免费体验。 > 免费额度用完后不可调用

5.15 虚拟模特

模型名称 输出单价
wanx-virtualmodel 目前仅供免费体验。 > 免费额度用完后不可调用
virtualmodel-v2

5.16 鞋靴模特

模型名称 输出单价
shoemodel-v1 目前仅供免费体验。 > 免费额度用完后不可调用。

5.17 创意海报生成

模型名称 输出单价
wanx-poster-generation-v1 目前仅供免费体验。 > 免费额度用完后不可调用

5.18 人物写真生成-FaceChain

  • facechain-facedetect:限时免费。
  • facechain-finetune:按训练次数计费,请求失败不计费。
  • facechain-generation:输入不计费,输出计费。
模型服务 模型名称 单价
人物图像检测 facechain-facedetect 限时免费
人物形象训练 facechain-finetune 2.5元/次
人物写真生成 facechain-generation 0.18元/张

5.19 创意文字生成-WordArt锦书

模型服务 模型名称 输出单价
文字纹理生成 wordart-texture 0.08元/张
文字变形 wordart-semantic 0.24元/张

更多模型调用计费可通过百炼控制台查询。

2026年截至目前,阿里云的AI产品优惠权益还有阿里云百炼 Token Plan,提供多档位套餐,包月预算可控;Qwen3.6 发布,全模型通享 4.5 折;旗舰模型入门首选,适配千行百业 AI 落地;AI 创新场景应用,开箱即用,适配千行百业 AI 落地;阿里云百炼按量达标返券,先用后返,最高返200元;阿里云 JVS Claw 39元起,一键接入 OpenClaw;先进弹性的 AI 算力,高性价比 AI 算力,快速部署千问大模型等其他优惠,详情可通过阿里云权益中心了解:https://www.aliyun.com/benefit

阿里云百炼券200元.png

除了AI产品优惠权益之外,云服务器相关活动也是用户非常关心的,在阿里云2026年的活动中,参与活动的云服务器主要有经济型e实例2核2G3M带宽40G ESSD Entry云盘99元1年;通用算力型u1实例2核4G5M带宽80G ESSD云盘企业专享199元1年,轻量云服务器2核2G200M峰值带宽38元一年、2核4G200M峰值带宽9.9元1个月和199元一年,以及通用算力型u2a实例2.5折起,通用算力型u2i实例3折,九代c9i、g9i、r9i等实例1年付6.4折起等其他实例规格的云服务器。更多云产品配置和实时价格可通过阿里云的活动中心:https://t.aliyun.com/U/3vGTeD 查询当前参与活动的云服务器和其他云产品配置的价格信息以及优惠券等信息,如下图所示:

活动中心展示.png

小结:阿里云百炼作为一站式大模型开发与应用平台,凭借其丰富的模型种类、强大的多模态能力、广泛的第三方开源模型接入以及灵活的调用计费机制,为开发者提供了高效、便捷、经济的AI开发环境。无论是复杂任务处理、通用场景应用,还是专用工具开发,阿里云百炼都能提供针对性的解决方案。同时,新人免费额度政策和详细的计费规则,进一步降低了AI开发的门槛和成本,使得更多企业和开发者能够轻松拥抱AI,推动业务创新与发展。

相关文章
|
1天前
|
存储 缓存 人工智能
阿里云百炼大模型服务平台是什么?最新模型调用收费标准、新人免费额度以及常见问题解答
阿里云百炼大模型服务平台是集成千问及第三方模型的一站式开发与应用平台,提供模型调用、调优、部署及应用构建等全链路服务。其优势包括丰富的模型生态、全链路开发工具、企业级安全合规及灵活计费模式,支持低/零代码开发,助力企业与开发者快速落地AI应用。2026年,新用户开通即享超7000万免费tokens,有效期90天,仅限模型推理调用,旨在降低初期成本,助力用户快速构建AI应用。
|
1天前
|
存储 缓存 人工智能
当 Agent 从模型调用,走向系统工程:OpenAI 和 LangChain 的两种实践
OpenAI与LangChain最新实践揭示:AI Agent 正从“模型调用”迈向“系统工程”。前者以 WebSocket 优化API链路,提速40%;后者强调Feedback驱动Trace闭环,实现持续演进。效率与进化,缺一不可。
|
21小时前
|
人工智能 IDE API
阿里云百炼Coding Plan产品简介:支持模型、收费标准及购买和使用常见问题解答
阿里云百炼Coding Plan是面向开发者和团队的AI编程订阅服务,采用固定月费模式,Pro套餐200元/月提供9万次调用额度,整合千问、Kimi、GLM、MiniMax等顶级模型,全面兼容Claude Code、OpenClaw、Cursor等主流编程工具。额度采用5小时滚动恢复、每周及每月定期重置机制,兼顾开发连续性与成本可控性。其折算成本远低于按量计费,并通过多层级额度设计和华北2地域绑定有效防范欠费风险。适合日常代码生成、智能体开发及IDE插件集成等场景,是开发者以可预期预算拥抱AI编程的高性价比选择。
阿里云百炼Coding Plan产品简介:支持模型、收费标准及购买和使用常见问题解答
|
11天前
|
编解码 人工智能 监控
阿里云百炼大模型HappyHorse介绍:功能与用途、适用场景与使用教程参考
阿里云百炼HappyHorse大模型服务平台,为用户提供文生视频、图生视频、参考生视频及视频编辑四大功能,支持高质量视频生成,适配广告、电商等多场景。该平台支持720P/1080P分辨率、3-15秒时长输出,具备有声支持、地域一致性校验及按秒计费(0.9元/秒起)等技术特性。用户可免费体验10秒视频生成,通过API配置实现智能创作,并遵循详细教程与地域化调用规范,高效完成视频生成与编辑工作流,赋能专业内容生产。
|
22小时前
|
人工智能 自然语言处理 API
阿里云百炼Token Plan团队版产品与收费标准介绍:标准版198元、高级版698元,尊享版1398元
阿里云百炼Token Plan团队版是面向企业和开发者的多模态AI大模型订阅服务,以Credits为统一计量单位,支持文本生成与图像生成模型灵活切换,兼容主流AI编程与智能体工具。提供标准、高级、尊享三档包月套餐,多租户隔离确保高峰不排队,并承诺不使用对话数据训练模型,保障数据安全。超出套餐额度可购买共享用量包,消费可通过控制台和费用中心实时监控。适用于AI编程集成、智能体开发等场景。配合Qwen3.6发布低至4.5折优惠及先用后返最高200元活动,可助力用户灵活控制AI预算。
|
2天前
|
弹性计算 安全 关系型数据库
阿里云服务器2核2G、2核4G、4核8G、8核16G怎么选实例?最新活动价格对比与实例规格选择指南
本文介绍了2026年阿里云服务器2核2G、2核4G、4核8G、8核16G配置的最新活动价格及选购指南。阿里云为个人开发者、初创团队及轻量级业务企业提供多样入门配置选择,如2核2G轻量应用服务器仅38元一年,2核4G配置199元包年。对于业务规模扩大或应用复杂度提升的用户,阿里云提供4核8G与8核16G配置,价格从1252.63元到5958.52元一年不等,满足不同性能需求。用户可根据业务需求和预算,在阿里云丰富产品线与优惠策略中选配最合适的云服务器实例。
|
3天前
|
人工智能 弹性计算 对象存储
阿里云2026优惠券全攻略:学生300元无门槛+百炼优惠券,企业迁云与出海补贴优惠券解析
阿里云2026年推出多类型优惠券,包括无门槛的学生300元优惠券及有门槛的算力、出海扶持和百炼“先用后返”等优惠券。学生优惠券覆盖广,有效期一年,适用于多种云产品,可拆分使用并与折扣叠加。百炼优惠券面向AI开发者,提供特别优惠。用户可通过阿里云控制台管理优惠券,需注意使用范围、有效期和叠加规则。企业用户可组合使用不同优惠券以优化成本。
|
2天前
|
人工智能 弹性计算 关系型数据库
2026年阿里云企业用户专属优惠权益解析:企业迁云与出海扶持、免费试用、特惠云服务器介绍
阿里云针对企业用户推出了一系列独享优惠,包括免费试用企业版云服务器、企业迁云和出海扶持补贴、企业专属特价云服务器及大促专属优惠券等。免费试用权益助力企业技术评估,特价云服务器满足企业长期稳定运行需求,迁云与出海补贴降低企业迁移和海外拓展成本,大促优惠券则进一步节约企业采购成本。此外,还有多种云产品和AI产品优惠权益。阿里云通过多层次优惠,为企业提供高性价比的云基础设施支持。
|
10天前
|
弹性计算 安全 关系型数据库
阿里云特惠云服务器99元和199元1年新购续费同价:配置、适用场景与专属组合套餐解析
阿里云推出的99元1年和199元1年新购续费同价云服务器因价格实惠、性能适中,深受个人和普通企业用户的喜爱。99元经济型e实例适合个人开发者等搭建轻量级应用;199元通用算力型u1实例则能稳定支持中小型企业官网等场景。此外,阿里云还提供建站礼包、安全防护、弹性数据库、高效存储及多场景组合套餐等专属优惠,并构建了一个丰富、灵活、高性价比的云产品生态,助力用户无忧上云、轻松降本。

热门文章

最新文章