Qwen3.6-Max-Preview:阿里云新一代千问旗舰预览版大模型,性能表现登顶最佳国产模型,阿里云正式推出Qwen3.6-Max-Preview新一代千问旗舰预览版大模型。凭借在知识理解、指令遵循、智能体编程等维度的全面跃升,该模型在国际权威评测机构 Artificial Analysis 榜单中登顶最佳国产大模型,多项核心指标超越同梯队产品,成为企业级 AI 应用与复杂智能体任务的首选底座。在阿里云通义大模型官网查看Qwen3.6-Max-Preview最新性能参数信息。
一、核心突破:六大编程基准全线领先
Qwen3.6-Max-Preview 定位超强智能体基座模型,相比 Qwen3.6-Plus 实现跨越式升级,尤其在长流程、高复杂度的编程与工具调用场景表现突出:
- SWE-bench Pro:智能体编码能力大幅提升
- Terminal-Bench 2.0:终端命令执行与自动化任务领先
- SkillsBench:技能生成与复用能力创新高
- QwenClawBench:真实场景智能体任务表现最优
- QwenWebBench:前端代码生成、多模态渲染评分领先
- SciCode:科研代码能力显著优于上一代
同时在世界知识、中文理解、指令遵循三大维度刷新纪录:
- QwenChineseBench 中文知识基准:84.0 高分
- AA-Omniscience 知识可靠性与幻觉控制:13.0
- ToolcallFormatIFBench 工具调用规范遵循:行业顶尖水平
二、三大核心能力,重新定义国产大模型
1. 超强智能体能力,支持长流程复杂任务
专为 AI Agent 优化,可自主规划、执行、复盘复杂任务,适配自动化运维、代码工程、业务流程编排、多工具串联等场景,更适合企业级落地。
2. 知识更准、幻觉更少
在真实知识、专业领域、事实性问答上可靠性大幅提升,适用于客服、知识库问答、法律 / 医疗 / 金融等对准确性要求极高的行业场景。
3. 指令遵循更强,工具调用更稳
支持复杂格式、多步骤指令、跨平台工具调用,对接 API、函数调用、插件系统更稳定,企业集成成本更低。
三、如何使用:阿里云百炼 + Qwen Studio 双入口
Qwen3.6-Max-Preview 已开放体验与调用,企业与开发者可快速接入:
- 阿里云百炼平台调用
模型标识:qwen3.6-max-preview支持兼容 OpenAI 规范接口,可直接对接现有系统。新增 preserve_thinking 能力,保留模型思维链,大幅提升智能体任务效果,在阿里云百炼AI平台调用。 - Qwen Studio 在线体验
无需开发,直接网页对话测试模型能力,快速验证业务场景。
四、总结
Qwen3.6-Max-Preview 的发布,标志着阿里云大模型在智能体、编程、知识可靠性三大方向进入全球第一梯队。作为下一代旗舰预览版,它不仅是技术突破,更为企业数字化、AI 自动化、Agent 应用提供了更强大、更稳定、更易用的国产底座。
未来阿里云将持续迭代 Qwen3.6 系列模型,进一步提升性能、安全性与行业适配能力,助力千行百业迈入智能体时代。