Claude Code思考深度降67%,老金找到个深度数据说明案例,还有怎么破

在线体验各类最新模型,更有模型 免费Token 额度领取!
立即体验
简介: 这两天Claude Code社区炸了。有人翻了6852次会话记录,发现Claude Code的思考深度从1月到2月底,降了67%。老金我第一反应是:不会吧,我自己天天用,没感觉啊。结果看完数据,沉默了。今天老金我帮你把这件事从头到尾拆一遍。数据、原因、官方回应、临时修复方案,全给你。## 先看数据,数据不会说谎这件事的源头是GitHub上Claude Code的一个issue,编

这两天Claude Code社区炸了。
有人翻了6852次会话记录,发现Claude Code的思考深度从1月到2月底,降了67%。
老金我第一反应是:不会吧,我自己天天用,没感觉啊。
结果看完数据,沉默了。

今天老金我帮你把这件事从头到尾拆一遍。
数据、原因、官方回应、临时修复方案,全给你。

先看数据,数据不会说谎

这件事的源头是GitHub上Claude Code的一个issue,编号#42796。
https://github.com/anthropics/claude-code/issues/42796

发帖人是AMD的AI总监Stella。

Image

她分析了6852条会话日志,17871个思考块,234760次工具调用。

Image

核心数据如下。

思考深度:从2200字符降到720字符
1月份的基线是每次思考平均2200个字符。
到2月底,降到720个字符。
降幅67%。
你的AI助手从"写论文"变成了"写短信"。

Image

Image

先读后改的比例:从6.6降到2.0
正常编程工作流是先读懂代码再改。
1月份每改1次代码,平均先读6.6次。
到2月底,变成只读2次就改。
降幅70%。
意味着AI开始"不看就改"。

Image

不看就改的比例:从6.2%涨到33.7%
这个数据更吓人。
1月份只有6.2%的修改是没先读代码就动手的。
到2月底,三分之一多的修改都是盲改。
这在复杂项目里就是灾难。

Image

用户打断率:翻了12倍
1月份每1000次工具调用,用户只打断0.9次。
到2月底,打断11.4次。
说明用户越来越不满意AI的输出,频繁手动干预。

Image

成本:从345美元涨到42121美元
2月份总成本345美元。
3月份同样的使用量,成本42121美元。
涨了122倍。
你花更多的钱,得到更差的结果。

Image

还有几个辅助数据。
推理循环从每千次8.2涨到26.6,翻了3倍多。
用户沮丧指标从5.8%涨到9.8%。
情感比率从4.4:1降到3.0:1,正面情绪崩了32%。

如果对你有帮助,记得关注一波~

官方怎么回应的

这个issue发出后,Anthropic的Claude Code团队的人(Boris)出来做了官方回应。

他说造成深度下降的原因有两个。

第一,Opus 4.6自适应思考默认开启(2月9日)
Opus 4.6发布时引入了"自适应思考"机制。
AI会自己判断任务复杂度,决定思考多深。
简单任务想少点,复杂任务想多点。
听起来合理,但实际执行中,AI倾向于把所有任务都判断为"简单"。

第二,Medium effort默认值设为85(3月3日)
Claude Code的思考强度有一个effort参数。
0是不思考,100是全力思考。
3月3日的更新把默认值设成了85。
看起来不低,但配合自适应思考一起用,效果被放大了。

Boris还澄清了一件事:很多人以为是redact-thinking(思考内容折叠显示)导致的。
他说这只是UI层面的变化,不影响实际思考深度。

临时修复方案

官方给了三个临时方案。

方案一:手动设置高努力模式
在对话中输入 /effort high。
每次会话都要手动输一次。
这个方案最简单,但容易忘。
CCS里可以直接开启它。

Image

方案二:环境变量关闭自适应思考
设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。
加到你的shell配置文件里,永久生效。

方案三:开启思考摘要显示
在设置里打开 showThinkingSummaries: true。
让你能看到AI到底想了多少,方便判断是否偷懒。

但Stella(报告作者)说了,即使三个方案全用上,思考深度大概也只能恢复到原来的十分之一。
不是完全恢复。

社区反应

老金我翻了Reddit的讨论,300多条评论。
大部分人都在说同一件事:"难怪最近Claude Code变蠢了"。

有人晒了自己的使用日志,数据趋势和Stella的报告完全吻合。
有人说已经切换到Codex和GPT了。
也有人说自己没感觉到变化,因为他们习惯把任务拆得很细,每个子任务比较简单,影响不大。

中文社区这边反应也很强烈。
华尔街见闻的标题直接写"思考深度骤降67%,无法再信任其处理复杂工程任务"。
新浪财经用了"翻车"这个词。
知乎和linux.do上都在讨论。

老金的实话

说几个值得注意的事。

这件事的本质是效率优化翻车了
Anthropic的出发点是好的。
自适应思考能省Token,能提速度。
但问题是,优化效率不能以牺牲质量为代价。
特别是编程这种容错率极低的场景。
一个"不看就改"就能把你的项目搞崩。

122倍成本增长触目惊心
从345到42121美元。
用户没多干什么活,钱涨了122倍。
这已经不是效率问题了,是商业信任问题。
你省钱省到了用户头上,还让用户买单。

官方回应态度还可以但不够
Boris出来回应了,给了临时方案,说了未来计划。
这些都值得肯定。
但临时方案不能完全恢复,这是事实。
Teams和Enterprise版本未来会默认高努力模式,但个人用户呢?
老金我自己就是个人用户,我等不起。

这件事会改变AI编程工具的竞争格局
Claude Code过去半年是AI编程工具的王牌。
Cursor、Windsurf、Codex都在追。
这次翻车,给了竞对一个窗口期。
已经有人开始试Codex了。

谁需要做什么

如果你是Claude Code重度用户
立刻设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。
每次开复杂任务前输 /effort high。
这不是可选的,是必须的。

如果你是企业团队
关注Anthropic后续的Teams版本更新。
默认高努力模式是企业版才有的待遇。
评估一下近期是否需要临时切换工具。

如果你偶尔用Claude Code
影响不大。
简单任务的自适应思考没有明显问题。
只有跨文件、复杂逻辑的任务才会受影响。

如果你在选AI编程工具
暂时别把鸡蛋放一个篮子里。
Claude Code还是最强的,但这次的信任裂痕需要时间修复。
同时关注Cursor和Codex的进展。

老金我自己已经开始在复杂项目里强制用high effort了。
简单任务无所谓,复杂任务绝对不能让它偷懒。
你们现在的使用体验怎么样?
评论区聊聊,老金我很想知道你们有没有感觉到变化。


飞书**开源知识库(实时更新 交流群**):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf

Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

相关文章
|
5月前
|
人工智能 运维 机器人
Claude Sonnet4.6编程追平Opus了,价格便宜4成,老金算了笔账
![Image](https://ucc.alicdn.com/pic/developer-ecology/p3shvhj26rigq_7f903ffb487546248d74ac452521566f.jpg) OSWorld 72.5%——昨晚(2月17日)刷到这个数据的时候,老金我反复确认了三遍。 Anthropic发布了Claude Sonnet 4.6,编程能力首次追平Opus,价格却只
Claude Sonnet4.6编程追平Opus了,价格便宜4成,老金算了笔账
|
3月前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
46887 72
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
5月前
|
人工智能 监控 API
Claude Code终于有仪表盘了:3条命令装个HUD,上下文用了多少一眼就知道
老金我最近用Claude Code,遇到一个特别烦的事。 写着写着,突然蹦出来一句"context window is getting full"。 然后AI就开始犯傻了——回答变短、逻辑变乱、之前说好的方案全忘了。 每次遇到这种情况,老金我都想骂人。 问题出在哪? Claude Code的终端界面,压根看不到上下文用了多少。 你只能输入 /context手动查,但谁写代码的时候
12714 9
|
6月前
|
人工智能 运维 前端开发
Claude Code 30k+ star官方插件,小白也能写专业级代码
Superpowers是Claude Code官方插件,由核心开发者Jesse打造,上线3个月获3万star。它集成brainstorming、TDD、系统化调试等专业开发流程,让AI写代码更规范高效。开源免费,安装简单,实测显著提升开发质量与效率,值得开发者尝试。
13131 5
|
机器学习/深度学习 自然语言处理 搜索推荐
神经网络算法 —— Embedding(嵌入)!!
神经网络算法 —— Embedding(嵌入)!!
5779 1
|
2月前
|
人工智能 安全 API
Claude和GPT全买了,AI用起来为啥还是不好用?老金来告你!
先说一个可能不太舒服的结论。 AI用得好不好,跟工具几乎没关系。 老金我在一开始认为模型越好就行了。 换了Claude、GPT、Gemini轮着试。 结果发现不对——同样的工具,不同人用出来的效果完全不同。 你可以做一个实验。 找两个同事,一个干过三年产品,一个刚入行。 让他们用同一个AI,写一份竞品分析报告。 资深的人出来的东西,方向对,框架稳。 该查哪些数据口径心
|
2月前
|
人工智能 程序员 API
Claude Code 的 Agent View,让我看到 AI 编程真正麻烦的地方
这两天 Claude Code 又更新了一个东西,叫 Agent View。 一开始我以为这就是个小功能,后来仔细看完官方文档,感觉这事儿有点东西。 它解决的不是模型会不会写代码的问题。 它解决的是当你同时让几个 AI 去干活时,人到底怎么盯、怎么插手、怎么拍板。 官方变更记录里,Agent View 被放在 Claude Code v2.1.139 里,还是 Research Pre
|
6月前
|
人工智能 API 开发工具
Skills比MCP更重要?更省钱的多!Python大佬这观点老金测了一周终于懂了
加我进AI学习群,公众号右下角“联系方式”。文末有老金开源知识库·全免费。本文详解Claude Skills为何比MCP更轻量高效:极简配置、按需加载、省90% token,适合多数场景。MCP仍适用于复杂集成,但日常任务首选Skills。推荐先用SKILL.md解决,再考虑协议。附实测对比与配置建议,助你提升效率,节省精力。关注老金,一起玩转AI工具。
|
3月前
|
人工智能 监控 JavaScript
Claude Code 必装插件:claude-hud 让你的 AI 编程效率翻倍
![封面图](https://oscimg.oschina.net/oscnet/up45b3d45a4d73cfc21ab909d1632066be5b9.png) JeecgBoot AI专题研究 Claude Code 状态监控插件 claudehud 深度体验与实战指南 你真的了解 Cla
4374 1
Claude Code 必装插件:claude-hud 让你的 AI 编程效率翻倍