解锁智能体新纪元:Qwen3.7-Max 正式发布,开启长程自主执行新时代

简介: Qwen3.7-Max 是面向Agentic时代的全能基座模型,实现从“说得好”到“做得到”的范式跃迁。它以35小时全自主芯片优化、顶尖推理与编程能力(GPQA 92.4、SWE-80.4)、双模式推理及全栈Agent化架构,树立国产大模型新标杆。

这不仅仅是一次常规的模型迭代,而是一次核心范式的转移。正如我们在杭州云栖峰会所说,大模型正在经历从“对齐人类偏好”到“对齐任务目标”的转变。过去的模型追求“说得好”,而 Qwen3.7-Max 的目标是“做得到”。

作为面向 Agentic 时代 的全能基座模型,Qwen3.7-Max 在编程、推理、工具调用及长周期任务执行上实现了质的飞跃。
image.png

📊 国产模型登顶,性能比肩国际顶尖

根据三方机构 Arena 全球大模型盲测总榜,Qwen3.7-Max 位列国产模型第一,其综合性能已接近 GPT、Claude 和 Gemini 的最强版本
在权威 benchmarks 上,它展现出极强的统治力:

推理能力:在 GPQA Diamond 测试中获得 92.4 分,超越 Claude Opus-4.6(91.3)。

编程智能体:SWE-Verified 得分 80.4,与业界顶尖水平持平。

通用智能体:MCP-Mark 得分 60.8,超越 GLM-5.1 等竞品。

🚀 核心亮点:不仅是助手,更是“长期主义者”

1.惊心动魄的 35 小时:完全自主的工程壮举

Qwen3.7-Max 最引人注目的能力,是它展现了前所未有的长周期自主执行能力。
在阿里云内部的“极限测试”中,我们向 Qwen3.7-Max 抛出了一个它从未接触过的命题:在一款全新的、未发布的平头哥“真武M890”芯片上优化 AI 推理内核。

模型仅凭一份硬件任务说明书,在没有人类干预、纠错的情况下:

  • 连续工作 35 小时

  • 进行了 1158 次工具调用

  • 独立完成了 432 次内核评估与代码重构

最终,它将芯片的推理速度较官方原生版本提升了 10 倍。这证明了 Qwen3.7-Max 能够像一名顶级工程师一样,进行长程规划、试错、重构并最终交付成果。相比之下,前代模型在该任务中仅能达到 1.1 倍的加速比

2. 深度 Agent 化架构

Qwen3.7-Max 原生支持 MCP(模型上下文协议) 集成和多智能体协作。它经过深度优化,完美适配 Claude Code、OpenClaw、Qwen Code 等主流智能体框架。

无论是在复杂的多文件软件工程中编写代码,还是在自动化办公流中协调数十个微服务,它都能保持稳定的推理与执行。

🛠 技术前沿:双模式推理与全栈 Agent 化

为了帮助开发者平衡性能与成本,Qwen3.7-Max 引入了双推理模式:

  • Think 模式:适用于复杂任务,模型会进行深度推理和规划,类似于“系统二”思维。

  • No-Think 模式:适用于简单任务和快速响应,提供低延迟、高效率的反馈。

此外,阿里云已完成从底层芯片到上层云产品的全栈 Agent 化升级。这意味着云产品的“消费者”正从人变为智能体,未来的云服务将更像是一系列可供模型调用的“Skill(技能)

🌐 可用性与接入

Qwen3.7-Max 即将通过 阿里云百炼平台(Model Studio) 向全球开发者开放 API 接入。

同时,随着 “真武M890” AI 芯片和 128 卡超节点服务器 的发布,阿里云提供了业界性价比极高的推理算力支持
image.png

立即访问阿里云百炼控制台,申请 Qwen3.7-Max 的体验资格,让你的智能体也拥有“持久战”的能力!

阿里云百炼控制台地址:https://bailian.console.aliyun.com/cn-beijing

相关文章
|
10天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
2973 20
|
7天前
|
人工智能 开发工具 iOS开发
Claude Code 新手完全上手指南:安装、国产模型配置与常用命令全解
Claude Code 是一款运行在终端环境中的 AI 编程助手,能够直接在命令行中完成代码生成、项目分析、文件修改、命令执行、Git 管理等开发全流程工作。它最大的特点是**任务驱动、终端原生、轻量高效、多模型兼容**,无需图形界面、不依赖 IDE 插件,能够深度融入开发者日常工作流。
2764 5
|
22天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23563 14
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
3天前
|
人工智能 Linux BI
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
JeecgBoot AI专题研究 一键脚本:Claude Code + JeecgBoot Skills + DeepSeek 全平台接入 一行命令装好 Claude Code + JeecgBoot Skills + DeepSeek 接入,无需翻墙使用 Claude Code,支持 Wind
1709 2
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
|
9天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
2342 3
|
8天前
|
人工智能 安全 开发工具
Claude Code 官方工作原理与使用指南
Claude Code 不是传统代码补全工具,而是 Anthropic 推出的终端 AI 代理,具备代理循环、双驱动架构(模型+工具)、全局项目感知、6 种权限模式等核心能力,本文基于官方文档系统解析其工作原理与高效使用技巧。
1248 0
|
16天前
|
人工智能 缓存 Shell
Claude Code 全攻略:命令大全 + 实战工作流(完整版)
Claude Code 是一款运行在终端环境下的 AI 编码助手,能够直接在项目目录中理解代码结构、编辑文件、执行命令、执行开发计划,并支持持久化记忆、上下文压缩、后台任务、多模型切换等专业能力。对于日常开发、项目维护、快速重构、代码审查等场景,它可以大幅减少手动操作、提升编码效率。本文从常用命令、界面模式、核心指令、记忆机制、图片处理、进阶工作流等维度完整说明,帮助开发者快速上手并稳定使用。
3676 6

热门文章

最新文章