解锁智能体新纪元:Qwen3.7-Max 正式发布,开启长程自主执行新时代

简介: Qwen3.7-Max 是面向Agentic时代的全能基座模型,实现从“说得好”到“做得到”的范式跃迁。它以35小时全自主芯片优化、顶尖推理与编程能力(GPQA 92.4、SWE-80.4)、双模式推理及全栈Agent化架构,树立国产大模型新标杆。

这不仅仅是一次常规的模型迭代,而是一次核心范式的转移。正如我们在杭州云栖峰会所说,大模型正在经历从“对齐人类偏好”到“对齐任务目标”的转变。过去的模型追求“说得好”,而 Qwen3.7-Max 的目标是“做得到”。

作为面向 Agentic 时代 的全能基座模型,Qwen3.7-Max 在编程、推理、工具调用及长周期任务执行上实现了质的飞跃。
image.png

📊 国产模型登顶,性能比肩国际顶尖

根据三方机构 Arena 全球大模型盲测总榜,Qwen3.7-Max 位列国产模型第一,其综合性能已接近 GPT、Claude 和 Gemini 的最强版本
在权威 benchmarks 上,它展现出极强的统治力:

推理能力:在 GPQA Diamond 测试中获得 92.4 分,超越 Claude Opus-4.6(91.3)。

编程智能体:SWE-Verified 得分 80.4,与业界顶尖水平持平。

通用智能体:MCP-Mark 得分 60.8,超越 GLM-5.1 等竞品。

🚀 核心亮点:不仅是助手,更是“长期主义者”

1.惊心动魄的 35 小时:完全自主的工程壮举

Qwen3.7-Max 最引人注目的能力,是它展现了前所未有的长周期自主执行能力。
在阿里云内部的“极限测试”中,我们向 Qwen3.7-Max 抛出了一个它从未接触过的命题:在一款全新的、未发布的平头哥“真武M890”芯片上优化 AI 推理内核。

模型仅凭一份硬件任务说明书,在没有人类干预、纠错的情况下:

  • 连续工作 35 小时

  • 进行了 1158 次工具调用

  • 独立完成了 432 次内核评估与代码重构

最终,它将芯片的推理速度较官方原生版本提升了 10 倍。这证明了 Qwen3.7-Max 能够像一名顶级工程师一样,进行长程规划、试错、重构并最终交付成果。相比之下,前代模型在该任务中仅能达到 1.1 倍的加速比

2. 深度 Agent 化架构

Qwen3.7-Max 原生支持 MCP(模型上下文协议) 集成和多智能体协作。它经过深度优化,完美适配 Claude Code、OpenClaw、Qwen Code 等主流智能体框架。

无论是在复杂的多文件软件工程中编写代码,还是在自动化办公流中协调数十个微服务,它都能保持稳定的推理与执行。

🛠 技术前沿:双模式推理与全栈 Agent 化

为了帮助开发者平衡性能与成本,Qwen3.7-Max 引入了双推理模式:

  • Think 模式:适用于复杂任务,模型会进行深度推理和规划,类似于“系统二”思维。

  • No-Think 模式:适用于简单任务和快速响应,提供低延迟、高效率的反馈。

此外,阿里云已完成从底层芯片到上层云产品的全栈 Agent 化升级。这意味着云产品的“消费者”正从人变为智能体,未来的云服务将更像是一系列可供模型调用的“Skill(技能)

🌐 可用性与接入

Qwen3.7-Max 即将通过 阿里云百炼平台(Model Studio) 向全球开发者开放 API 接入。

同时,随着 “真武M890” AI 芯片和 128 卡超节点服务器 的发布,阿里云提供了业界性价比极高的推理算力支持
image.png

立即访问阿里云百炼控制台,申请 Qwen3.7-Max 的体验资格,让你的智能体也拥有“持久战”的能力!

阿里云百炼控制台地址:https://bailian.console.aliyun.com/cn-beijing

相关文章
|
1天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
7598 32
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
1天前
|
人工智能 缓存 监控
阿里云百炼上线Qwen3.7-Max,支持API与Token Plan调用,解析及配置实战指南
2026年5月,阿里云百炼平台正式上线通义千问系列最新旗舰模型**Qwen3.7-Max**,标志着国产大模型正式迈入智能体时代。作为面向Agentic时代设计的全能基座模型,Qwen3.7-Max实现了从“说得好”到“做得到”的范式跃迁,在推理、编程、长周期自主执行等核心能力上实现质的飞跃。该模型已全面支持**标准API调用**与**Token Plan订阅调用**两种方式,企业与开发者可根据自身需求灵活选择,快速接入顶级AI能力。
2010 2
|
1天前
|
人工智能 自然语言处理 监控
阿里云百炼通义千问Qwen3.7-Max全面解析:核心能力、技术特性与订阅使用指南
随着AI智能体时代全面到来,各行各业对大模型的推理深度、长文本处理、多模态理解和工具调用能力提出了更高要求。阿里云百炼正式推出**Qwen3.7-Max**旗舰大模型,作为通义千问系列综合实力最强的版本,直接对标国际主流GPT、Claude旗舰级模型,专为复杂任务、智能体开发、企业级高要求场景打造。
1245 1
|
1天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
|
3月前
|
人工智能 弹性计算 数据可视化
部署OpenClaw有哪些成本?附OpenClaw低成本部署指南
OpenClaw(“养龙虾”)是一款开源AI代理框架,可自动化文件处理、工作流与消息管理。本文详解其部署成本:软件免费,云服务器低至68元/年,阿里云百炼新用户享7000万Token免费额度,并提供一键图形化部署指南。
1217 32
|
1天前
|
决策智能
首发!Qoder 内置模型已支持 Qwen3.7-Max
Qoder已同步首发阿里云全新旗舰模型Qwen3.7-Max!该模型在Arena全球盲测中居国产第一,专为Agent优化,编程与推理能力卓越,支持复杂开发、多智能体协作及办公自动化。即刻通过Qoder全系产品体验!
|
1天前
|
人工智能 缓存 运维
AI智能体协同实战:Hermes Agent+Claude Code接入阿里云百炼Token Plan完整教程
2026年,AI智能体已经从单一代码助手,进化为能够协同工作的虚拟开发团队。Hermes Agent与Claude Code的组合,成为当前最成熟、最高效的AI开发搭档:Hermes Agent负责任务规划、需求拆解、记忆沉淀与流程调度,扮演技术主管角色;Claude Code专注代码生成、文件修改、命令执行与工程落地,承担核心开发工作。二者配合,可实现从需求分析到代码落地的全流程自动化,大幅提升研发效率。
595 3
|
1天前
|
人工智能 缓存 安全
阿里云百炼:重磅发布Qwen3.7 Max 面向智能体时代的新一代旗舰模型
阿里云百炼重磅发布Qwen3.7-Max旗舰大模型,面向智能体时代,支持100万tokens超长上下文、30K RPM高并发,具备卓越编程能力、MCP集成与长周期自主执行能力。现推理后付费限时5折,新用户可免费试用100万Tokens。开百炼免费体验:https://t.aliyun.com/U/fPVHqY
|
1天前
|
存储 人工智能 弹性计算
Qwen3.7 新品特惠来袭|多模态 Plus + 旗舰 Max 双模型,低成本落地智能体开发
阿里云百炼重磅上线Qwen3.7系列:Plus版(多模态经济型)支持图文视频理解,Max版(旗舰文本模型)擅长大文档、代码与复杂推理。新用户免费领7000万Tokens,Plus推理8折、Max限时5折,全用户每日200次Max免费调用,一站式降低AI应用落地成本。
|
1天前
|
人工智能 索引
详解GEO优化的落地步骤和流程
越来越多企业重视GEO(生成式引擎优化),却苦于无从下手。本文基于多年实战经验,系统拆解GEO落地三步法:前期精准定位、中期5步实操(内容矩阵→语义关键词→技术适配→部署监测→迭代优化)、后期长效维护,避坑提效,助力品牌抢占AI流量入口。(239字)
358 4

热门文章

最新文章