Qwen3.6-Max-Preview震撼发布!登顶国产模型榜首,智能体编程能力再攀高峰

简介: 阿里云通义实验室发布Qwen3.6-Max-Preview预览版,通义大模型官网:https://t.aliyun.com/U/JbblVp 登顶“最佳国产大模型”。其在智能体编程、世界知识与指令遵循三大维度全面超越前代,支持多工具协同、长程任务与思维链保留(preserve_thinking),已上线百炼API及Qwen Studio。

阿里云通义实验室再次引领国产大模型技术浪潮,正式推出 Qwen3.6-Max-Preview —— 新一代千问旗舰模型的早期预览版本。这款模型不仅在权威评测中强势登顶“最佳国产模型”宝座,更在智能体(Agent)编程、世界知识储备和指令遵循能力三大核心维度上,实现了对前代产品Qwen3.6-Plus的全面超越,详细在阿里云通义大模型官网查看。

一、性能登顶:权威评测下的实力证明

根据知名AI评测平台 Artificial Analysis 的最新榜单,Qwen3.6-Max-Preview凭借其卓越的综合性能,一举成为当前表现最佳的国产大语言模型。

这一成就并非偶然,而是其在多项关键基准测试中取得突破性进展的必然结果。

二、三大核心能力跃升:重新定义AI智能体

Qwen3.6-Max-Preview的核心升级聚焦于让AI从“能聊”走向“能干”,尤其在处理复杂、多步骤的真实世界任务时,展现出前所未有的可靠性与效率。

✅ 1. 智能体编程能力:业界领先

Qwen3.6-Max-Preview登顶最佳国产模型.png


在六大主流编程基准测试中,Qwen3.6-Max-Preview均取得了最佳成绩,包括:

  • SWE-bench Pro:软件工程问题解决
  • Terminal-Bench 2.0:终端命令行操作
  • SkillsBench & QwenClawBench:通用与特定技能执行
  • QwenWebBench:网页交互与信息提取
  • SciCode:科学代码生成与理解

这意味着,它能够更精准地理解开发者的意图,并自主完成从需求分析、代码编写、调试到部署的完整软件开发生命周期中的复杂任务。

✅ 2. 世界知识:广度与深度兼备

模型在 SuperGPQA(高难度科学知识问答)和 QwenChineseBench(中文综合知识)等评测中创下新高。这确保了AI在回答专业领域问题或进行跨学科推理时,能够提供更准确、更可靠的信息,减少“幻觉”现象。

Qwen3.6-Max-Preview在主流性能评测中的表现.png

✅ 3. 指令遵循:精准执行每一步

ToolcallFormatIFBench 等指令遵循评测中,Qwen3.6-Max-Preview同样表现优异。它能更严格地遵守用户的格式要求和操作步骤,这对于需要精确控制的自动化流程至关重要。

三、真实场景表现:解决更复杂、更长程的任务

理论评测的胜利最终要服务于真实世界的挑战。Qwen3.6-Max-Preview在实际应用中,能够胜任那些需要长期规划、多工具协同和复杂逻辑推理的长程任务。无论是自动完成一个完整的市场分析报告,还是协调多个API接口构建一个自动化工作流,它都展现出了更强的稳定性和成功率。

四、如何体验Qwen3.6-Max-Preview?

阿里云为开发者和企业用户提供了便捷的接入方式:

  • 通过阿里云百炼API:模型将很快上线,模型名称为 qwen3.6-max-preview。百炼平台兼容行业标准协议,包括OpenAI和Anthropic的API规范,方便现有应用无缝迁移。
  • 通过Qwen Studio:用户可直接在Qwen Studio平台上即时体验该模型的强大功能。
  • 阿里云权益中心 查看最新阿里云AI大模型免费额度、节省计划费用清单。

🔧 特别功能:preserve_thinking

本次发布还支持一项针对智能体任务的关键功能——preserve_thinking。该功能允许在API请求的消息中保留所有前序轮次的思维链(Chain-of-Thought)内容,极大地提升了智能体在处理多轮、复杂任务时的上下文连贯性和决策质量。

结语

作为一款预览版模型,Qwen3.6-Max-Preview已经展现了其作为下一代旗舰的非凡潜力。它的发布不仅是阿里云在大模型技术上的又一次重大突破,更为整个AI智能体生态的发展注入了强劲动力。随着模型的持续迭代与优化,我们有理由相信,一个由AI智能体深度赋能的高效、自动化未来,正加速到来。

相关文章
|
2月前
|
人工智能 运维 前端开发
Qwen3.6-Max-Preview:阿里云新一代千问旗舰预览版大模型,性能表现登顶最佳国产模型
阿里云推出Qwen3.6-Max-Preview旗舰预览版大模型,阿里云AI大模型官网:https://t.aliyun.com/U/JbblVp 登顶最佳国产大模型。在编程(六大基准全线领先)、知识理解(中文基准84.0分)、指令遵循与工具调用等方面全面跃升,专为AI智能体与企业级复杂任务优化,支持百炼平台与Qwen Studio双入口快速接入。(239字)
1505 1
|
2月前
|
弹性计算 人工智能 自然语言处理
阿里云Qwen3.6全新开源,三步完成专有版部署!
Qwen3.6是阿里云全新MoE架构大模型系列,稀疏激活显著降低推理成本,兼顾顶尖性能与高性价比;支持多规格、FP8量化、原生Agent及100+语言,开箱即用。
|
1天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
7694 33
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
1天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
|
1天前
|
人工智能 缓存 安全
阿里云百炼:重磅发布Qwen3.7 Max 面向智能体时代的新一代旗舰模型
阿里云百炼重磅发布Qwen3.7-Max旗舰大模型,面向智能体时代,支持100万tokens超长上下文、30K RPM高并发,具备卓越编程能力、MCP集成与长周期自主执行能力。现推理后付费限时5折,新用户可免费试用100万Tokens。开百炼免费体验:https://t.aliyun.com/U/fPVHqY
|
1天前
|
人工智能 缓存 监控
阿里云百炼上线Qwen3.7-Max,支持API与Token Plan调用,解析及配置实战指南
2026年5月,阿里云百炼平台正式上线通义千问系列最新旗舰模型**Qwen3.7-Max**,标志着国产大模型正式迈入智能体时代。作为面向Agentic时代设计的全能基座模型,Qwen3.7-Max实现了从“说得好”到“做得到”的范式跃迁,在推理、编程、长周期自主执行等核心能力上实现质的飞跃。该模型已全面支持**标准API调用**与**Token Plan订阅调用**两种方式,企业与开发者可根据自身需求灵活选择,快速接入顶级AI能力。
2046 2
|
2月前
|
人工智能 运维 安全
阿里云Qwen3.6-27B是什么?阿里云Qwen3.6-27B 解析:稠密架构、百万上下文与企业级部署
阿里云Qwen3.6-27B是通义千问团队推出的一款**270亿参数稠密型多模态大语言模型**,以“小参数、强性能”为核心定位,在编程能力、长文本处理、多模态理解与智能体执行等方面实现突破性表现,是面向开发者与企业的新一代开源旗舰模型。该模型采用Apache 2.0开源协议,支持完全商用、本地部署与二次开发,凭借稠密架构的简洁性、百万级上下文能力与媲美千亿模型的智能体表现,成为当前开源社区的热门选择。以下从技术架构、核心能力、性能表现、部署方式与应用场景等维度,全面解析Qwen3.6-27B的全貌。
2711 3
|
2月前
|
人工智能 自然语言处理 测试技术
DeepSeek V4:百万上下文,万亿参数,以及重新泛起涟漪的开源池塘
DeepSeek V4发布Pro(1.6T参数/49B激活)与Flash(284B/13B)双模型,均支持1M上下文、thinking模式及Agent能力。全栈开源(权重+技术报告+API+定价),采用混合注意力架构显著降本,中文长文本与推理能力突出,是当前少有的万亿级开源系统级发布
1951 4
DeepSeek V4:百万上下文,万亿参数,以及重新泛起涟漪的开源池塘