智谱大模型刷屏技术圈:GLM-4.7 是怎么一步步“能干活”的?

简介: GLM-4.7引爆技术圈,不止因性能跃升,更因其将大模型带入工程化落地新阶段。它聚焦编程与Agent任务,通过“交织式思考”、高效数据筛选、强化学习框架Slime等创新,实现从“答得对”到“做得完”的跨越。智谱不仅发布模型,更公开整套训练体系,推动AI从Demo走向真实生产。

过去一周,技术社区被一个名字反复刷屏:GLM-4.7。

不是发布会造势,也不是营销话术,而是实打实地在 Coding、Agent、前端审美、工程稳定性 等多个维度,把一堆榜单和开发者的预期同时点燃。

更关键的是—— 这一次,智谱 并不只是“发了个更强的模型”,而是把一整套「如何把模型练成能干活的工程体系」摊在了台面上。

3504c91b-26bd-4122-9dbe-67b5f4479108.png

一、不是“参数变大”,而是模型真的更会做事了
GLM-4.7 的核心变化,不在于参数规模,而在于目标发生了偏移:

从“答得对”,转向“做得完”。

它的主攻方向非常明确:编程任务 + Agent 式多步骤执行。

这也是为什么它在真实软件工程、终端操作、复杂项目理解这些场景里,明显更稳。

0731c5af-766f-4e22-ad97-4f010cd1c0cc.png

https://substackcdn.com/image/fetch/f_auto%2Cq_auto%3Agood%2Cfl_progressive%3Asteep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fb0c08743-6000-455c-ad3a-12850617cefd_1600x1073.png

6c210f38-4fce-4ae7-81bf-03ecf16e21d5.png

智谱团队在 AMA 中说得很直白: 他们在后训练阶段做的事情,几乎都围绕一个目标——让模型在复杂任务中少跑偏。

二、训练思路的变化:不是猛堆数据,而是“先验证再上桌”
在模型性能跃迁这件事上,GLM-4.7 走的是一条偏工程化的路线。

核心策略可以总结为三点:

数据不是越多越好,而是越“有效”越好
不同领域(代码、数学、科学)使用不同清洗与筛选规则
每一类数据,都会先在同架构的小模型上做消融实验
换句话说:

进大模型训练的数据,必须先“证明自己有用”。

这种流程非常像严谨的软件工程:先小流量验证,再全量上线。

三、交织式思考:让模型“边想边做”,而不是一次性拍脑袋
GLM-4.7 在推理机制上有一个非常关键的变化,智谱给它起了个名字:

交织式思考(Interleaved Thinking)
保留式思考(Preserved Thinking)
轮级思考(Turn-level Thinking)
如果翻译成人话,其实很简单:

不再“一口气想完再执行”, 而是 每一步都先想清楚,再往下走。

5f71f42d-75cc-4a87-a6fe-c49926bea189.png

9bd56426-ebda-4ea3-b6f9-df7aff96d4c5.png

f0f75c99-c732-48c4-8611-38cd6278e550.png

caf16b3d-523f-4cae-8b02-e499871cf241.png

这对 Agent 任务非常重要。 因为一旦第一步规划错了,后面只会错得更彻底。

四、为什么它在 Agent 框架里表现更好?
一个容易被忽略的事实是:模型 ≠ 最终效果。

智谱在 AMA 中明确提到:

Agent 框架本身,对最终成功率的影响,可能占到 30% 左右。

因此,他们在 Agent 系统里重点打磨了三件事:

系统提示词结构
工具调用的层级设计
多 Agent 并行时的稳定性
这也是为什么 GLM-4.7 在复杂、多步骤任务中,更不容易“走着走着就散了”。

五、UI 审美突然开窍?其实是被“硬练”出来的
很多人惊讶:

“这代 GLM 怎么突然这么好看?”

答案一点都不玄学。

智谱给出的解释是: 他们单独组了一个前端与网页开发团队,专门做一件事——把审美当能力训练。

训练方式也很工程:

收集高质量网页与 UI 案例
使用视觉语言模型(VLM)参与数据筛选
强化布局、比例、动效、层级这些“非语义能力”

最终效果就是: 生成结果不再只是“能用”,而是接近可交付。

六、从小游戏到复杂交互:模型已经能“跑完整流程”
在实际演示中,GLM-4.7 已经可以:

一次性生成完整的前端小游戏
支持多轮自然语言修改规则
保持逻辑一致,不崩结构
这背后体现的不是“写代码能力”,而是对整体工程结构的理解能力。

换句话说: 它开始像一个“能配合的工程师”,而不只是代码生成器。

七、开源不是口号:智谱把 RL 框架也一并端了出来
这次发布中,一个被很多人低估但极其重要的东西是:

强化学习框架 Slime。

Slime 的目标很明确: 把强化学习从“实验室技巧”,变成可长期运转的工程流水线。

f6062571-0c85-4fba-be1d-8073ea459215.png

5fd4dd8e-694e-4a39-a908-a6598d9c2b34.png

它支持:

任务生成
执行与测试
自动反馈
持续迭代
真正解决的问题只有一个:怎么把模型练成“会干活的 Agent”。

八、接下来会发生什么?
关于版本节奏,智谱的态度很耐人寻味:

不排除直接跳过 4.8 / 4.9
GLM-5 可能直接登场
此外,还有两个明确的信号:

新一代 IDE Zcode 正在路上
模型 + 工具 + Agent,会一起打包推进
从方向上看,他们已经不太纠结“榜单第一”,而是更关注一件事:

模型如何真正进入生产,而不是停在 Demo。

写在最后
GLM-4.7 真正引爆技术圈的原因,并不只是“又一个更强模型”。

而是它释放了一个清晰信号:

大模型竞争,正在从“谁更聪明”, 进入“谁更工程化、谁更能落地”的阶段。

这场变化,才刚刚开始。

相关文章
|
12天前
|
数据采集 人工智能 安全
|
7天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
340 164
|
6天前
|
机器学习/深度学习 自然语言处理 机器人
阿里云百炼大模型赋能|打造企业级电话智能体与智能呼叫中心完整方案
畅信达基于阿里云百炼大模型推出MVB2000V5智能呼叫中心方案,融合LLM与MRCP+WebSocket技术,实现语音识别率超95%、低延迟交互。通过电话智能体与座席助手协同,自动化处理80%咨询,降本增效显著,适配金融、电商、医疗等多行业场景。
344 155
|
7天前
|
编解码 人工智能 自然语言处理
⚽阿里云百炼通义万相 2.6 视频生成玩法手册
通义万相Wan 2.6是全球首个支持角色扮演的AI视频生成模型,可基于参考视频形象与音色生成多角色合拍、多镜头叙事的15秒长视频,实现声画同步、智能分镜,适用于影视创作、营销展示等场景。
555 4
|
15天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
1009 7