以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元

简介: 阿里巴巴开源全新一代千问Qwen3.5-Plus:全球最强开源大模型,3970亿参数、仅激活170亿,原生多模态,支持图文视频理解与长视频分析;推理吞吐量最高提升19倍,API价格低至0.8元/百万Token。

刚刚,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,登顶全球最强开源模型。

该模型总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。

目前,千问APP、PC端已接入Qwen3.5-Plus模型。开发者可在魔搭社区和HuggingFace下载新模型,同时可在阿里云百炼直接获取API服务(文末点击阅读原文可直接跳转)。Qwen3.5-Plus的API价格每百万Token低至0.8元。

原生多模态模型--模型性能全方位提升

与前几代的千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁。

千问3预训练在纯文本Tokens上进行,而千问3.5则基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据,让张开“眼睛”的大模型学会了更密集的世界知识和推理逻辑,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的顶尖性能,在推理、编程、Agent智能体等全方位基准评估中均表现优异。

比如,千问3.5在MMLU-Pro认知能力评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro。

原生多模态训练,也带来千问3.5的视觉能力飞跃:在多模态推理(MathVison)、通用视觉问答VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等众多权威评测中,千问3.5均斩获最佳性能。

在学科解题、任务规划与物理空间推理等任务上,千问3.5相比千问专项模型Qwen3-VL表现更好,空间定位推理和带图推理能力均大幅增强,推理分析更精细、精准;在视频理解方面,千问3.5支持长达2小时(1M token上下文)的视频直接输入,适用于长视频内容分析与摘要生成;同时,千问3.5实现了视觉理解与代码能力的原生融合,结合图搜和生图工具,可将手绘界面草图直接转为可用的前端代码,一张截图就能定位并修复UI问题,让视觉编程真正成为生产力工具。

创新门控技术--小参数实现极致性能

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。千问团队自研的门控技术成果,曾斩获全球AI顶会2025 NeurIPS最佳论文,该前沿技术已融入到千问3.5创新的混合架构中去,团队结合线性注意力机制与稀疏混合专家MoE模型架构,实现了397B总参数激活仅17B的极致模型效率;同时,千问3.5通过训练稳定优化以及多 token 预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

千问3.5推理效率大幅提升

最大吞吐量提升至19倍

千问3.5的原生多模态训练,是在阿里云AI基础设施上高效完成的。通过系列基础技术创新,千问3.5在文本、图像、视频等混合数据训练吞吐量,几近100%持平纯文本基座模型训练,大举降低了原生多模态训练的难度门槛;同时,通过设计精巧的FP8、FP32精度应用策略,在训练稳定扩展到数十万亿个token时,激活内存减少约50% ,训练还能提速10% ,进一步提升了节约了模型训练成本、提升了训练效率。

Agent应用进一步突破--智能体支持扩展至百万级

基于顶级视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。

千问3.5可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。

同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将基于插件的智能体Agent支持扩展至百万级规模。

1月15日,千问App发布全球首个消费级AI购物Agent。春节期间,千问AI购物Agent6天时间帮用户完成了1.2亿笔订单,在全球首次实现大规模真实世界任务执行和商业化验证。Agent能力大幅增强的千问3.5,将进一步打开千问APP在工作和生活中帮人办事的想象空间。

自2023年开源以来,阿里已开源400多个千问模型,覆盖全尺寸、全模态,千问全球下载量突破10亿次,单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和,开发者基于千问开发的衍生模型超20万,是公认的全球第一开源模型,也是开发者最友好的开源大模型。

面向不同国家的AI开发者和企业的需求,千问大模型还在持续演进:千问3.5扩展支持201种语言,将词表大小从150k扩展到250K,可最高提升小语种60%的编码效率。

此外,不同尺寸、不同功能的千问3.5系列模型也将陆续开源发布。性能更强的旗舰模型Qwen3.5-Max不久后也将发布,敬请期待。

/ END /

相关文章
|
19天前
|
机器学习/深度学习 人工智能 自然语言处理
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
阿里巴巴开源全新一代千问Qwen3.5-Plus,全球最强开源大模型:3970亿参数、仅激活170亿,原生多模态,支持图文视频理解与视觉编程;推理吞吐量最高提升19倍,API价格低至0.8元/百万Token。
|
17天前
|
机器学习/深度学习 人工智能 监控
阿里除夕开源千问3.5:3970亿参数但只激活170亿,大模型部署成本砍半怎么做到的?
本文探讨 AI 落地深水区的成本与效率难题,解析阿里 Qwen3.5 通过混合注意力、稀疏 MoE 等技术实现性能跃升与降本增效,并对比 Prompt、RAG 与微调的适用场景,指出企业应结合模型特性规划技术路线,借助平台实现 AI 从能用向好用进阶。
980 4
|
22天前
|
机器学习/深度学习 API
Qwen3.5 开源家族扩容!
通义千问Qwen3.5系列重磅开源:含397B、122B、35B、27B四款模型,覆盖高性能与高性价比场景;新增Qwen3.5-Flash API,支持百万token上下文及原生工具链,已在阿里云百炼上线。
1995 4
|
19天前
|
人工智能 API
重磅!阿里云Coding Plan全面上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5
阿里云Coding Plan上线Qwen3.5、GLM-5、M2.5、K2.5四大顶尖开源模型,支持Qwen Code等工具自由切换。Lite/Pro套餐首月仅7.9元/39.9元,分别享1.8万/9万次请求。Qwen3.5以397B总参、17B激活参数实现高性价比,全面优化编程与Agent能力。
|
19天前
|
人工智能 安全 API
CoPaw:5分钟部署你的 AI助理
源自阿里巴巴开源生态的个人 AI 助理——CoPaw。作为阿里倾力打造的开源力作,CoPaw 完美打通钉钉、飞书、Discord 等多平台对话通道,支持定时任务自动化。内置 PDF/Office 深度处理、新闻摘要等强大技能,更开放自定义扩展接口。坚持数据全程私有化部署,绝不上传云端,让每一位用户都能在大厂技术加持下,拥有安全、专属的智能助手。
|
20天前
|
人工智能
上新!阿里云Coding Plan支持千问3.5、GLM-4.7、Kimi-K2.5等模型
阿里云Coding Plan上新Qwen 3.5-Plus、GLM-4.7、Kimi-K2.5等编程模型,支持自由切换。新用户首月享2折:Lite版18000次请求仅7.9元,Pro版90000次仅39.9元,适配Qwen Code、Claude Code等主流工具。
上新!阿里云Coding Plan支持千问3.5、GLM-4.7、Kimi-K2.5等模型
|
20天前
|
存储 人工智能 Java
准确率提升至 90%,阿里商旅基于 AgentScope 构建多智能体差旅助手最佳实践
阿里商旅AliGo通过代码化多智能体架构升级,选用AgentScope框架+Python/Java混合栈+FastAPI,构建“快慢车道”意图识别、实时思考链与流式输出、分层上下文工程及动态Prompt状态机,事项收集准确率从50%提升至90%+,获InfoQ与量子位2025年度AI大奖。
准确率提升至 90%,阿里商旅基于 AgentScope 构建多智能体差旅助手最佳实践
|
2月前
|
机器学习/深度学习 人工智能 测试技术
重磅!千问最强模型正式发布
阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking:参数超万亿、预训练数据达36T Tokens,规模与能力均为当前最强。采用全新测试时扩展机制,推理更智能、更经济;原生Agent能力大幅增强,可自主调用工具。开发者与用户均可免费体验。
1970 1
重磅!千问最强模型正式发布
|
20天前
|
人工智能 前端开发 API
AI Agent系列|什么是 ReAct Agent?
本系列文章基于 Lynxe 作者沈询的实战经验,深入浅出解析 ReAct Agent 的核心原理与工程价值,帮助开发者快速掌握从“写流程”到“造智能体”的关键跃迁。
|
20天前
|
人工智能 自然语言处理 前端开发
AI Agent系列|深入解析Function Calling、MCP和Skills的本质差异与最佳实践
本系列文章基于 Lynxe 作者沈询的实战经验,深入浅出解析 ReAct Agent 的核心原理与工程价值,帮助开发者快速掌握从“写流程”到“造智能体”的关键跃迁。

热门文章

最新文章