Claude Code思考深度降67%，老金找到个深度数据说明案例，还有怎么破-阿里云开发者社区

Claude Code思考深度降67%，老金找到个深度数据说明案例，还有怎么破

2026-04-09 187

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 这两天Claude Code社区炸了。有人翻了6852次会话记录，发现Claude Code的思考深度从1月到2月底，降了67%。老金我第一反应是：不会吧，我自己天天用，没感觉啊。结果看完数据，沉默了。今天老金我帮你把这件事从头到尾拆一遍。数据、原因、官方回应、临时修复方案，全给你。## 先看数据，数据不会说谎这件事的源头是GitHub上Claude Code的一个issue，编

这两天Claude Code社区炸了。
有人翻了6852次会话记录，发现Claude Code的思考深度从1月到2月底，降了67%。
老金我第一反应是：不会吧，我自己天天用，没感觉啊。
结果看完数据，沉默了。

今天老金我帮你把这件事从头到尾拆一遍。
数据、原因、官方回应、临时修复方案，全给你。

先看数据，数据不会说谎

这件事的源头是GitHub上Claude Code的一个issue，编号#42796。
https://github.com/anthropics/claude-code/issues/42796

发帖人是AMD的AI总监Stella。

她分析了6852条会话日志，17871个思考块，234760次工具调用。

核心数据如下。

思考深度：从2200字符降到720字符
1月份的基线是每次思考平均2200个字符。
到2月底，降到720个字符。
降幅67%。
你的AI助手从"写论文"变成了"写短信"。

先读后改的比例：从6.6降到2.0
正常编程工作流是先读懂代码再改。
1月份每改1次代码，平均先读6.6次。
到2月底，变成只读2次就改。
降幅70%。
意味着AI开始"不看就改"。

不看就改的比例：从6.2%涨到33.7%
这个数据更吓人。
1月份只有6.2%的修改是没先读代码就动手的。
到2月底，三分之一多的修改都是盲改。
这在复杂项目里就是灾难。

用户打断率：翻了12倍
1月份每1000次工具调用，用户只打断0.9次。
到2月底，打断11.4次。
说明用户越来越不满意AI的输出，频繁手动干预。

成本：从345美元涨到42121美元
2月份总成本345美元。
3月份同样的使用量，成本42121美元。
涨了122倍。
你花更多的钱，得到更差的结果。

还有几个辅助数据。
推理循环从每千次8.2涨到26.6，翻了3倍多。
用户沮丧指标从5.8%涨到9.8%。
情感比率从4.4:1降到3.0:1，正面情绪崩了32%。

如果对你有帮助，记得关注一波~

官方怎么回应的

这个issue发出后，Anthropic的Claude Code团队的人（Boris）出来做了官方回应。

他说造成深度下降的原因有两个。

第一，Opus 4.6自适应思考默认开启（2月9日）
Opus 4.6发布时引入了"自适应思考"机制。
AI会自己判断任务复杂度，决定思考多深。
简单任务想少点，复杂任务想多点。
听起来合理，但实际执行中，AI倾向于把所有任务都判断为"简单"。

第二，Medium effort默认值设为85（3月3日）
Claude Code的思考强度有一个effort参数。
0是不思考，100是全力思考。
3月3日的更新把默认值设成了85。
看起来不低，但配合自适应思考一起用，效果被放大了。

Boris还澄清了一件事：很多人以为是redact-thinking（思考内容折叠显示）导致的。
他说这只是UI层面的变化，不影响实际思考深度。

临时修复方案

官方给了三个临时方案。

方案一：手动设置高努力模式
在对话中输入 /effort high。
每次会话都要手动输一次。
这个方案最简单，但容易忘。
CCS里可以直接开启它。

方案二：环境变量关闭自适应思考
设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。
加到你的shell配置文件里，永久生效。

方案三：开启思考摘要显示
在设置里打开 showThinkingSummaries: true。
让你能看到AI到底想了多少，方便判断是否偷懒。

但Stella（报告作者）说了，即使三个方案全用上，思考深度大概也只能恢复到原来的十分之一。
不是完全恢复。

社区反应

老金我翻了Reddit的讨论，300多条评论。
大部分人都在说同一件事："难怪最近Claude Code变蠢了"。

有人晒了自己的使用日志，数据趋势和Stella的报告完全吻合。
有人说已经切换到Codex和GPT了。
也有人说自己没感觉到变化，因为他们习惯把任务拆得很细，每个子任务比较简单，影响不大。

中文社区这边反应也很强烈。
华尔街见闻的标题直接写"思考深度骤降67%，无法再信任其处理复杂工程任务"。
新浪财经用了"翻车"这个词。
知乎和linux.do上都在讨论。

老金的实话

说几个值得注意的事。

这件事的本质是效率优化翻车了
Anthropic的出发点是好的。
自适应思考能省Token，能提速度。
但问题是，优化效率不能以牺牲质量为代价。
特别是编程这种容错率极低的场景。
一个"不看就改"就能把你的项目搞崩。

122倍成本增长触目惊心
从345到42121美元。
用户没多干什么活，钱涨了122倍。
这已经不是效率问题了，是商业信任问题。
你省钱省到了用户头上，还让用户买单。

官方回应态度还可以但不够
Boris出来回应了，给了临时方案，说了未来计划。
这些都值得肯定。
但临时方案不能完全恢复，这是事实。
Teams和Enterprise版本未来会默认高努力模式，但个人用户呢？
老金我自己就是个人用户，我等不起。

这件事会改变AI编程工具的竞争格局
Claude Code过去半年是AI编程工具的王牌。
Cursor、Windsurf、Codex都在追。
这次翻车，给了竞对一个窗口期。
已经有人开始试Codex了。

谁需要做什么

如果你是Claude Code重度用户
立刻设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。
每次开复杂任务前输 /effort high。
这不是可选的，是必须的。

如果你是企业团队
关注Anthropic后续的Teams版本更新。
默认高努力模式是企业版才有的待遇。
评估一下近期是否需要临时切换工具。

如果你偶尔用Claude Code
影响不大。
简单任务的自适应思考没有明显问题。
只有跨文件、复杂逻辑的任务才会受影响。

如果你在选AI编程工具
暂时别把鸡蛋放一个篮子里。
Claude Code还是最强的，但这次的信任裂痕需要时间修复。
同时关注Cursor和Codex的进展。

老金我自己已经开始在复杂项目里强制用high effort了。
简单任务无所谓，复杂任务绝对不能让它偷懒。
你们现在的使用体验怎么样？
评论区聊聊，老金我很想知道你们有没有感觉到变化。

飞书**开源知识库（实时更新交流群**）：
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf

Claude Code & Openclaw 双顶流全中文从零开始的教程：不懂代码照样造网站，老金15万字Claude Code+OpenClaw教程免费开源

每次我都想提醒一下，这不是凡尔赛，是希望有想法的人勇敢冲。
我不会代码，我英语也不好，但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧，迎接新的时代。

谢谢你读我的文章。
如果觉得不错，随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送，也可以给我个星标⭐～谢谢你看我的文章。

Claude Code思考深度降67%，老金找到个深度数据说明案例，还有怎么破

先看数据，数据不会说谎

官方怎么回应的

临时修复方案

社区反应

老金的实话

谁需要做什么

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Claude Code思考深度降67%，老金找到个深度数据说明案例，还有怎么破

先看数据，数据不会说谎

官方怎么回应的

临时修复方案

社区反应

老金的实话

谁需要做什么

热门文章

最新文章

相关电子书