Token是什么?阿里云Tokens是如何计费吗?AI大模型词元收费标准

简介: Token是AI处理文本的最小单位,阿里云按输入/输出分别计费,价格因模型而异(如Qwen-Max:2.4/9.6元/百万Tokens)。新用户开通百炼可领7000万免费Tokens,企业用户还可申领万亿Tokens扶持及多重优惠。

Token是什么?Token是AI处理文字的 “最小单位”,可以理解为AI处理一句话、写一句话时,用的 “文字碎片”,云厂商是通过Tokens实际使用量的多少来计算费用的。阿里云Tokens是如何计费吗?AI大模型词元收费标准,阿里云Tokens是如何计费的?AI大模型不同Token收费标准也不同,另外输入Token和输出Token也是分别计费的,目前阿里云Tokens是有优惠活动的,阿里云提供万亿Tokens扶持,开通阿里云百炼平台还可以免费领取超7000万Tokens,阿小云整理2026年最新阿里云Tokens优惠活动、收费标准及免费Tokens领取教程:


免费领取超7000万Tokens(每个模型免费100万Tokens)

目前无论是个人用户还是企业用户,第一次开通阿里云百炼AI大模型平台,都可以免费领取7000万Tokens,开通阿里云百炼:https://www.aliyun.com/product/bailian 如下图:


百炼是阿里云推出的AI大模型开发及应用构建一站式平台,开通就可以免费领取Tokens。

阿里云万亿Tokens扶持

阿里云2026年最新开年活动「AI焕新季,马上用千问」,阿里云活动链接:https://www.aliyun.com/activity/purchase/aistartup 如下图:


一键申请千问焕新计划至高享2000元优惠,全量模型先用后返至高5000元,节省计划低至4.5折,领券下单再减1728元。


申请阿里云万亿Tokens是有条件的,必须是阿里云企业新用户,如下图:


AI大模型优惠活动(OpenClaw及大模型节省计划)

阿里云权益中心:https://www.aliyun.com/benefit 目前阿里云提供9.9元快速部署OpenClaw以及大模型节省计划低至4.5折,如下图:


阿里云Tokens计费规则及收费标准

AI大模型不同收费价格不同,tokens输入和输出的价格也不同,另外模型的部署地域也会影响实际的Tokens计费,阿小云分享整理不同AI大模型、不同地域的Tokens收费价格:

aliyunaidamoxingfeiyong.jpg

1、千问Max系列

中国内地部署:

  • 输入单价:2.4元/百万Tokens
  • 输出单价:9.6元/百万Tokens(非思考模式)
  • 免费额度:各100万Tokens(输入/输出),有效期90天
  • 适用模型:qwen-max、qwen-max-latest等

2、千问Plus系列

中国内地部署:

输入单价:阶梯计价(按单次请求的输入Token范围):

≤128K Tokens:0.8元/百万

128K–256K Tokens:2元/百万

256K–1M Tokens:4元/百万

输出单价(非思考模式):

≤128K Tokens:4.8元/百万

128K–256K Tokens:12元/百万

256K–1M Tokens:24元/百万

  • 思考模式:输出单价与非思考模式相同。
  • 免费额度:各100万Tokens(输入/输出),有效期90天。
  • 适用模型:qwen-plus、qwen-plus-latest等。

国际/美国部署:

输入单价:阶梯计价(按单次请求的输入Token范围):

≤256K Tokens:2.936元/百万

256K–1M Tokens:8.807元/百万

输出单价(非思考模式):

≤256K Tokens:8.807元/百万

256K–1M Tokens:26.421元/百万

免费额度:同上。

3、千问Turbo系列

中国内地部署:

  • 输入单价:0.367元/百万
  • 输出单价:1.468元/百万
  • 适用模型:qwen-turbo-2024-11-01等

4、千问Flash系列

中国内地部署:

  • 输入单价:无阶梯计价,0.8元/百万(Batch调用半价后0.4元/百万)
  • 输出单价:2元/百万(Batch调用半价后1元/百万)
  • 免费额度:各100万Tokens

5、千问Long系列

中国内地部署:

  • 输入单价:0.5元/百万
  • 输出单价:2元/百万(Batch调用半价后1元/百万)
  • 适用模型:qwen-long、qwen-long-latest等

6、千问Omni系列(多模态)

中国内地部署:

  • 文本输入:0.4元/百万
  • 图像/视频输入:1.5元/百万
  • 文本输出(纯文本输入):1.6元/百万
  • 多模态输出:4.5元/百万

免费额度:各100万Tokens。

7、千问OCR系列

中国内地部署:

  • 输入单价:0.3元/百万
  • 输出单价:0.5元/百万

适用模型:qwen-vl-ocr等

8、千问Coder系列(代码生成)

中国内地部署:

输入单价:阶梯计价(按输入Token范围):

≤32K:1元/百万

32K–128K:1.5元/百万

128K–256K:2.5元/百万

256K–1M:5元/百万

输出单价:阶梯计价(按输出Token范围):

≤32K:4元/百万

32K–128K:6元/百万

128K–256K:10元/百万

256K–1M:25元/百万

免费额度:各100万Tokens。

9、其他模型

QVQ系列(视觉问答):

  • 输入单价:2–8元/百万
  • 输出单价:5–32元/百万
  • 适用场景:图像生成与分析

阿里云Coding Plan

阿里云还有一种Tokens计费模式,每月支付固定的订阅费用,然后通过请求次数来计费的,在阿里云百炼平台订阅Coding Plan:https://www.aliyun.com/benefit/scene/codingplan 之前Coding Plan是有活动的,可以享受7.9元首月的优惠价格,但是现在活动是限量的了,如下图:


以上是阿小云整理2026年最新的Tokens收费标准,包括官方定价的计费标准、Tokens补贴优惠活动、免费Tokens申请以及Coding Plan计费说明。

相关文章
|
12天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
11398 121
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
2天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
2984 7
|
21小时前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
1292 1
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
12天前
|
人工智能 IDE API
2026年国内 Codex 安装教程和使用教程:GPT-5.4 完整指南
Codex已进化为AI编程智能体,不仅能补全代码,更能理解项目、自动重构、执行任务。本文详解国内安装、GPT-5.4接入、cc-switch中转配置及实战开发流程,助你从零掌握“描述需求→AI实现”的新一代工程范式。(239字)
7172 139
|
1天前
|
云安全 供应链 安全
Axios投毒事件:阿里云安全复盘分析与关键防护建议
阿里云云安全中心和云防火墙第一时间响应
1073 0
|
2天前
|
人工智能 自然语言处理 数据挖掘
零基础30分钟搞定 Claude Code,这一步90%的人直接跳过了
本文直击Claude Code使用痛点,提供零基础30分钟上手指南:强调必须配置“工作上下文”(about-me.md+anti-ai-style.md)、采用Cowork/Code模式、建立标准文件结构、用提问式提示词驱动AI理解→规划→执行。附可复制模板与真实项目启动法,助你将Claude从聊天工具升级为高效执行系统。
|
2天前
|
人工智能 定位技术
Claude Code源码泄露:8大隐藏功能曝光
2026年3月,Anthropic因配置失误致Claude Code超51万行源码泄露,意外促成“被动开源”。代码中藏有8大未发布功能,揭示其向“超级智能体”演进的完整蓝图,引发AI编程领域震动。(239字)
2047 9
|
10天前
|
人工智能 并行计算 Linux
本地私有化AI助手搭建指南:Ollama+Qwen3.5-27B+OpenClaw阿里云/本地部署流程
本文提供的全流程方案,从Ollama安装、Qwen3.5-27B部署,到OpenClaw全平台安装与模型对接,再到RTX 4090专属优化,覆盖了搭建过程的每一个关键环节,所有代码命令可直接复制执行。使用过程中,建议优先使用本地模型保障隐私,按需切换云端模型补充功能,同时注重显卡温度与显存占用监控,确保系统稳定运行。
2503 9