Claude Code思考深度降67%,老金找到个深度数据说明案例,还有怎么破

简介: 这两天Claude Code社区炸了。有人翻了6852次会话记录,发现Claude Code的思考深度从1月到2月底,降了67%。老金我第一反应是:不会吧,我自己天天用,没感觉啊。结果看完数据,沉默了。今天老金我帮你把这件事从头到尾拆一遍。数据、原因、官方回应、临时修复方案,全给你。## 先看数据,数据不会说谎这件事的源头是GitHub上Claude Code的一个issue,编

这两天Claude Code社区炸了。
有人翻了6852次会话记录,发现Claude Code的思考深度从1月到2月底,降了67%。
老金我第一反应是:不会吧,我自己天天用,没感觉啊。
结果看完数据,沉默了。

今天老金我帮你把这件事从头到尾拆一遍。
数据、原因、官方回应、临时修复方案,全给你。

先看数据,数据不会说谎

这件事的源头是GitHub上Claude Code的一个issue,编号#42796。
https://github.com/anthropics/claude-code/issues/42796

发帖人是AMD的AI总监Stella。

Image

她分析了6852条会话日志,17871个思考块,234760次工具调用。

Image

核心数据如下。

思考深度:从2200字符降到720字符
1月份的基线是每次思考平均2200个字符。
到2月底,降到720个字符。
降幅67%。
你的AI助手从"写论文"变成了"写短信"。

Image

Image

先读后改的比例:从6.6降到2.0
正常编程工作流是先读懂代码再改。
1月份每改1次代码,平均先读6.6次。
到2月底,变成只读2次就改。
降幅70%。
意味着AI开始"不看就改"。

Image

不看就改的比例:从6.2%涨到33.7%
这个数据更吓人。
1月份只有6.2%的修改是没先读代码就动手的。
到2月底,三分之一多的修改都是盲改。
这在复杂项目里就是灾难。

Image

用户打断率:翻了12倍
1月份每1000次工具调用,用户只打断0.9次。
到2月底,打断11.4次。
说明用户越来越不满意AI的输出,频繁手动干预。

Image

成本:从345美元涨到42121美元
2月份总成本345美元。
3月份同样的使用量,成本42121美元。
涨了122倍。
你花更多的钱,得到更差的结果。

Image

还有几个辅助数据。
推理循环从每千次8.2涨到26.6,翻了3倍多。
用户沮丧指标从5.8%涨到9.8%。
情感比率从4.4:1降到3.0:1,正面情绪崩了32%。

如果对你有帮助,记得关注一波~

官方怎么回应的

这个issue发出后,Anthropic的Claude Code团队的人(Boris)出来做了官方回应。

他说造成深度下降的原因有两个。

第一,Opus 4.6自适应思考默认开启(2月9日)
Opus 4.6发布时引入了"自适应思考"机制。
AI会自己判断任务复杂度,决定思考多深。
简单任务想少点,复杂任务想多点。
听起来合理,但实际执行中,AI倾向于把所有任务都判断为"简单"。

第二,Medium effort默认值设为85(3月3日)
Claude Code的思考强度有一个effort参数。
0是不思考,100是全力思考。
3月3日的更新把默认值设成了85。
看起来不低,但配合自适应思考一起用,效果被放大了。

Boris还澄清了一件事:很多人以为是redact-thinking(思考内容折叠显示)导致的。
他说这只是UI层面的变化,不影响实际思考深度。

临时修复方案

官方给了三个临时方案。

方案一:手动设置高努力模式
在对话中输入 /effort high。
每次会话都要手动输一次。
这个方案最简单,但容易忘。
CCS里可以直接开启它。

Image

方案二:环境变量关闭自适应思考
设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。
加到你的shell配置文件里,永久生效。

方案三:开启思考摘要显示
在设置里打开 showThinkingSummaries: true。
让你能看到AI到底想了多少,方便判断是否偷懒。

但Stella(报告作者)说了,即使三个方案全用上,思考深度大概也只能恢复到原来的十分之一。
不是完全恢复。

社区反应

老金我翻了Reddit的讨论,300多条评论。
大部分人都在说同一件事:"难怪最近Claude Code变蠢了"。

有人晒了自己的使用日志,数据趋势和Stella的报告完全吻合。
有人说已经切换到Codex和GPT了。
也有人说自己没感觉到变化,因为他们习惯把任务拆得很细,每个子任务比较简单,影响不大。

中文社区这边反应也很强烈。
华尔街见闻的标题直接写"思考深度骤降67%,无法再信任其处理复杂工程任务"。
新浪财经用了"翻车"这个词。
知乎和linux.do上都在讨论。

老金的实话

说几个值得注意的事。

这件事的本质是效率优化翻车了
Anthropic的出发点是好的。
自适应思考能省Token,能提速度。
但问题是,优化效率不能以牺牲质量为代价。
特别是编程这种容错率极低的场景。
一个"不看就改"就能把你的项目搞崩。

122倍成本增长触目惊心
从345到42121美元。
用户没多干什么活,钱涨了122倍。
这已经不是效率问题了,是商业信任问题。
你省钱省到了用户头上,还让用户买单。

官方回应态度还可以但不够
Boris出来回应了,给了临时方案,说了未来计划。
这些都值得肯定。
但临时方案不能完全恢复,这是事实。
Teams和Enterprise版本未来会默认高努力模式,但个人用户呢?
老金我自己就是个人用户,我等不起。

这件事会改变AI编程工具的竞争格局
Claude Code过去半年是AI编程工具的王牌。
Cursor、Windsurf、Codex都在追。
这次翻车,给了竞对一个窗口期。
已经有人开始试Codex了。

谁需要做什么

如果你是Claude Code重度用户
立刻设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。
每次开复杂任务前输 /effort high。
这不是可选的,是必须的。

如果你是企业团队
关注Anthropic后续的Teams版本更新。
默认高努力模式是企业版才有的待遇。
评估一下近期是否需要临时切换工具。

如果你偶尔用Claude Code
影响不大。
简单任务的自适应思考没有明显问题。
只有跨文件、复杂逻辑的任务才会受影响。

如果你在选AI编程工具
暂时别把鸡蛋放一个篮子里。
Claude Code还是最强的,但这次的信任裂痕需要时间修复。
同时关注Cursor和Codex的进展。

老金我自己已经开始在复杂项目里强制用high effort了。
简单任务无所谓,复杂任务绝对不能让它偷懒。
你们现在的使用体验怎么样?
评论区聊聊,老金我很想知道你们有没有感觉到变化。


飞书**开源知识库(实时更新 交流群**):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf

Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

相关文章
|
3月前
|
人工智能 运维 机器人
Claude Sonnet4.6编程追平Opus了,价格便宜4成,老金算了笔账
![Image](https://ucc.alicdn.com/pic/developer-ecology/p3shvhj26rigq_7f903ffb487546248d74ac452521566f.jpg) OSWorld 72.5%——昨晚(2月17日)刷到这个数据的时候,老金我反复确认了三遍。 Anthropic发布了Claude Sonnet 4.6,编程能力首次追平Opus,价格却只
Claude Sonnet4.6编程追平Opus了,价格便宜4成,老金算了笔账
|
3月前
|
人工智能 监控 API
Claude Code终于有仪表盘了:3条命令装个HUD,上下文用了多少一眼就知道
老金我最近用Claude Code,遇到一个特别烦的事。 写着写着,突然蹦出来一句"context window is getting full"。 然后AI就开始犯傻了——回答变短、逻辑变乱、之前说好的方案全忘了。 每次遇到这种情况,老金我都想骂人。 问题出在哪? Claude Code的终端界面,压根看不到上下文用了多少。 你只能输入 /context手动查,但谁写代码的时候
10376 8
|
4月前
|
人工智能 运维 前端开发
Claude Code 30k+ star官方插件,小白也能写专业级代码
Superpowers是Claude Code官方插件,由核心开发者Jesse打造,上线3个月获3万star。它集成brainstorming、TDD、系统化调试等专业开发流程,让AI写代码更规范高效。开源免费,安装简单,实测显著提升开发质量与效率,值得开发者尝试。
11187 5
|
3天前
|
人工智能 搜索推荐 程序员
豆包收费68到500,Codex收入7天翻倍,免费AI到头了
上个月翻信用卡账单,发现一个事。 AI相关的月订阅已经悄悄超过2000块了。 Claude,Chatgpt,Gemini,GLM,Minimax,即梦,挨个看了一遍,一个都舍不得停。 每一个都在某个工作流里,真离不开。 我以前觉得AI工具会越来越便宜,最终走向免费。 直到这周看到了两条消息。 ## 企业端在掏真金白银了 OpenAI发了条战报。 GPT-5.5发布一周,A
|
SQL 存储 关系型数据库
一个库帮你快速实现EF Core数据仓储模式
一个库帮你快速实现EF Core数据仓储模式
284 1
|
人工智能 API
别问谁更强,GPT-5.5和Opus4.7综合对比
本文不比模型“谁更强”,而是聚焦真实开发场景:GPT-5.5擅长短循环任务——查文档、跑命令、修小bug,省去频繁切换;Opus 4.7强在长交付任务——重构、审查、Agent执行,减少中断催促。选型关键不在跑分,而在任务形状。(239字)
|
2月前
|
人工智能 程序员 测试技术
Anthropic官方报告:8大趋势说透AI编程未来,60%代码AI写的,老金实测项目带你看!
上周老金我刷到一份报告,看完之后愣了半天。。。 不是那种"AI要取代程序员"的标题党。 而是 Anthropic(就是做Claude的那家公司)官方发布的《2026 Agentic Coding Trends Report》。 用真实数据告诉你,AI编程这件事,已经变天了。 老金我花了两天把这份报告啃完,今天帮你拆解最核心的内容。 ## 先说结论:程序员没被取代,但角色变了 报告里最让老金
|
3月前
|
存储 人工智能 开发工具
Claude Code自动记忆来了!配合老金三层记忆系统全开源!加强Plus!
昨天晚上,老金我照例打开 Claude Code 准备写代码。 随便聊了几句项目架构,Claude突然冒出一句: "Based on our previous discussions, this project uses pnpm and TypeScript strict mode." 老金我愣了一下。 上次提到pnpm是三天前的事了,这中间重启了好几次。 打开 ~/.claude/p
|
3月前
|
人工智能 编解码 运维
Nano Banana 2 来了,Google 把口喷修图卷上天了!4K 效果称王!
今天凌晨 Google 悄悄上线了 Nano Banana 2 的 Flash 模型。 老金我当时的反应是:又来?上次 Nano Banana 刚出的时候,社区吹得天花乱坠。 抱着"先试试看"的心态,老金我打开了 Gemini。 结果这一试,真的不一样了。 ## 先说 Nano Banana 到底是什么 很多人可能还不知道这玩意儿。 简单说,Nano Banana 是 Google