Claude Code 调优实操:改完这 10 个设置之后输出质量和效率可以翻倍

简介: Claude Code 编码变差?并非模型退化,而是Anthropic悄然将默认`effort`从high降至medium,并启用自适应思考等限制策略。10个关键配置(如`CLAUDE_CODE_DEFAULT_EFFORT=high`、权限规则、钩子脚本等)可彻底恢复其强大工程能力——调优配置比换模型更有效。

如果你最近感觉 Claude 编码变差了不少,这可能是因为Anthropic 悄悄修改了默认配置参数,而不是模型的问题。

Agent 思考变少了、语法更差、工具调用减少,注释也被去掉了。

模型本身没有退化,Anthropic只是把默认执行力度(effort)从"high"降到了"medium"而且没有发公告。

下面这 10 个隐藏设置可能大多数人从未动过,但是他们可能是削弱Claude Code 的原因。

Effort 参数

默认 effort 在 3 月被调低后,Agent 会主动规避深度推理。得强制引擎用完全部算力配额。会话中

/effort high

可以临时解决,但最好还是用配置来做

 export CLAUDE_CODE_DEFAULT_EFFORT=high

自适应思考关闭开关

2026 年 2 月起,Claude 开始自主决定每轮分配多少算力。遇到它判定为"简单"的任务,直接跳过思考步骤,然后就是灾难性的下游 bug。

用这个环境变量给每一轮固定推理预算:

 export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1

默认权限模式

默认安装几乎每次工具调用都要手动确认,有人在一个上午弹出 47 次确认提示。所以打开

settings.json

,把默认模式改为

acceptEdits

(可信仓库)或

plan

(不熟悉的代码库)。

 { "permissions": { "defaultMode": "acceptEdits" } }

Allow 和 Deny 规则

没有显式规则Claude 连

git status

这种基础命令都会停下来要许可。而且它还会悄悄读取

.env

.ssh

目录。所以可以在

settings.json

中把边界硬编码清楚。

 {  
   "permissions": {  
     "allow": ["Read", "Glob", "Edit", "Bash(git status)", "Bash(npm run *)"],  
     "deny": ["Read(**/.env*)", "Read(**/.ssh/**)", "Bash(sudo *)"]  
   }  
 }

会话中切换模型

用 Opus 回答简单的正则问题是在烧钱,因为Opus 的价格是 Sonnet 的 5 倍。动态路由:80% 的日常编码用

/model sonnet

,复杂架构重构时切

/model opus

,快速格式化降到

/model haiku

定向压缩

上下文窗口填满后,

/compact

会泛泛地总结会话,关键架构决策当场丢失。正确的用法是指定压缩方向:

/compact preserve all architecture decisions, file paths mentioned, and error messages

持久化项目记忆

如果要重复解释项目用

pnpm

而不是

npm

,说明这个工作流已经坏了。所以执行一次

/memory add "this project uses pnpm, not npm"

,让信息持久化到本地后续每次会话启动时自动加载。

控制 MCP Token 膨胀

Model Context Protocol (MCP) 服务器能力很强,但每个连接的服务器每轮加载超过 18,000 token 的开销。挂了 5 个空闲服务器,还没敲 Prompt 就已经烧掉 90,000 token。所以定期用

/mcp

把当前迭代用不上的服务器果断断开。

工具调用后自动格式化

Claude 写完代码还要手动跑 Prettier,执行循环就低效了。在

settings.json

里加一个

PostToolUse

钩子,Agent 写完

.ts

文件即刻触发格式化。

 {  
  "hooks": {  
    "PostToolUse": [  
      {  
        "matcher": "Write(*.ts)",  
        "hooks": [{ "type": "command", "command": "npx prettier --write $file" }]  
      }  
    ]  
  }  
 }

工具调用前日志过滤

让 Claude 直接读一个 10,000 行的服务器日志那上下文会被撑爆,所以可以用

PreToolUse

钩子先把文件过一遍

grep

 {  
  "hooks": {  
    "PreToolUse": [  
      {  
        "matcher": "Bash(cat *log*)",  
        "hooks": [{ "type": "command", "command": "grep -n 'ERROR\\|WARN' $file | head -50" }]  
      }  
    ]  
  }  
 }

所以Claude Code 是好用还是不好用,区别就在于环境变量和这个JSON的配置文件上。花 60 秒配好设置比换个模型要有用的多。

https://avoid.overfit.cn/post/5f54aedfbdee4f5d9166d5ad0a62e6f1

by Shashwat

目录
相关文章
|
12天前
|
人工智能 定位技术 Go
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径
Harness Engineering 是一套让AI在真实项目中稳定、可靠交付的工程系统,涵盖SPEC规范、Rule约束、Skill流程、Sub-Agent分工、Workflow编排、Script校验与MCP集成。它不追求模型更聪明,而是通过结构化机制消除随意性,实现可验证、可维护、可持续的AI协作开发。
308 1
从零搭建 Harness Engineering 框架 :Rule、Skill、Sub-Agent等工程落完整路径
|
18天前
|
机器学习/深度学习 算法 安全
2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 RL
本文梳理大模型对齐中强化学习的演进脉络:从PPO+RLHF起步,到DPO删去奖励模型、GRPO剔除Critic,再到MARL与智能体RL框架兴起。聚焦奖励信号变迁——由人类偏好转向可验证结果,并解析各算法适用场景、失效边界及开源技术栈(verl/TRL/Agent-R1等),揭示RL正从旁支走向LLM能力跃迁的核心引擎。
228 2
2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 RL
|
19天前
|
NoSQL 测试技术 Redis
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环
本文提出一种可审计、可改进的多Agent RAG系统:通过Orchestrator动态编排分解、检索、批判与合成Agent,结合Token预算管控、溯源式答案生成及SSE实时可观测性;首创Prompt自我改进闭环——自动定位薄弱维度、生成结构化改写、并经回归检测+人工审批上线,兼顾LLM系统质量与工程严谨性。
143 2
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环
|
6月前
|
数据可视化 安全 测试技术
Anthropic 开源 Bloom:基于 LLM 的自动化行为评估框架
Anthropic推出开源框架Bloom,可自动化评估大语言模型是否阿谀奉承、有政治倾向或绕过监管等行为。不同于传统基准,Bloom基于配置动态生成测试场景,支持多模型、多样化评估,并提供可视化分析,助力模型安全与对齐研究。(237字)
419 12
Anthropic 开源 Bloom:基于 LLM 的自动化行为评估框架
|
1月前
|
人工智能 自然语言处理 供应链
为什么 MCP 在协议层会有 prompt injection的问题:工具描述如何劫持 agent 上下文
MCP(Model Context Protocol)虽成AI Agent主流集成标准,但其将工具描述全量注入上下文的设计,导致“Context Poisoning”——恶意指令可借工具元数据污染LLM推理。OWASP将其列为LLM应用头号漏洞,2025年已致超10万站点遭袭。根本风险在于协议层信任模型缺失,非清洗不可用。
135 12
为什么 MCP 在协议层会有 prompt injection的问题:工具描述如何劫持 agent 上下文
|
26天前
|
人工智能 定位技术 数据库
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑
2026 RAG选型指南指出:Vector RAG已难胜任复杂场景;GraphRAG通过知识图谱支撑多跳关系推理,Vectorless RAG则摒弃向量库,依托文档树结构+LLM导航实现高精度定位。三者非替代,而应按问题类型智能路由——Adaptive RAG成企业新范式。
211 3
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑
|
6月前
|
存储 大数据 数据处理
别再浪费内存了:Python __slots__ 机制深入解析
Python中`__slots__`通过预定义属性名,避免使用`__dict__`存储,显著减少内存占用并提升访问速度。适用于需创建大量实例的场景,如数据处理、科学计算等,以牺牲动态添加属性为代价换取性能优化。
272 7
别再浪费内存了:Python __slots__ 机制深入解析
|
6月前
|
人工智能 JSON 缓存
1小时微调 Gemma 3 270M 端侧模型与部署全流程
Gemma 3 270M是谷歌推出的轻量级开源模型,可快速微调并压缩至300MB内,实现在浏览器中本地运行。本文教你用QLoRA在Colab微调模型,构建emoji翻译器,并通过LiteRT量化至4-bit,结合MediaPipe在前端离线运行,实现零延迟、高隐私的AI体验。小模型也能有大作为。
656 3
1小时微调 Gemma 3 270M 端侧模型与部署全流程
|
2月前
|
人工智能 机器人 中间件
LangChain 生态里的三层抽象:LangGraph、create_agent、Deep Agents
本文对比LangChain生态中三层智能体方案:`create_agent`(开箱即用、适合单轮工具调用)、Deep Agents(预装记忆/沙箱/子Agent,面向复杂长链路任务)和LangGraph(底层图编排引擎,支持分支、中断、持久化等深度定制)。推荐“从高抽象起步,遇瓶颈再下沉”。
250 6
LangChain 生态里的三层抽象:LangGraph、create_agent、Deep Agents
|
2月前
|
存储 设计模式 人工智能
从无状态到有状态:长时运行 Agent 的 5 种架构模式
本文详解长时运行AI Agent的5大生产级架构模式:Checkpoint-and-Resume实现断点续传;Delegated Approval支持原地暂停与人机协同;Memory-Layered Context分层管理长期记忆与工作记忆;Ambient Processing赋能无提示事件驱动;Fleet Orchestration实现多Agent协同治理——让Agent真正成为可靠、有状态、可运维的系统进程。
297 2
从无状态到有状态:长时运行 Agent 的 5 种架构模式