Claude和GPT全买了,AI用起来为啥还是不好用?老金来告你!

简介: 先说一个可能不太舒服的结论。 AI用得好不好,跟工具几乎没关系。老金我在一开始认为模型越好就行了。 换了Claude、GPT、Gemini轮着试。 结果发现不对——同样的工具,不同人用出来的效果完全不同。你可以做一个实验。 找两个同事,一个干过三年产品,一个刚入行。 让他们用同一个AI,写一份竞品分析报告。资深的人出来的东西,方向对,框架稳。 该查哪些数据口径心

先说一个可能不太舒服的结论。
AI用得好不好,跟工具几乎没关系。

老金我在一开始认为模型越好就行了。
换了Claude、GPT、Gemini轮着试。
结果发现不对——同样的工具,不同人用出来的效果完全不同。

你可以做一个实验。
找两个同事,一个干过三年产品,一个刚入行。
让他们用同一个AI,写一份竞品分析报告。

资深的人出来的东西,方向对,框架稳。
该查哪些数据口径心里有数。
稍微调调就能用。

初级的人出来的东西,结构漂亮,措辞专业。
但你一细看。。。该对标谁、该用哪个指标、结论能不能站住脚,全是不确定的。

同样的AI,同样的提示词,结果天差地别。
差别不在工具。在你脑子里装的东西。

具体说,是两块认知在起作用。
一块是你对事情本身的认知——你知不知道这个活该怎么干。
另一块是你对AI的认知——你知不知道AI有哪些能力、怎么组合着用。
这两块里面,AI认知这块又有两个层次:90%是提效,10%是反哺认知。

今天把这三层拆清楚。

你不知道该怎么做,AI也帮不了你

先说第一块,也是最容易被忽略的一块。

有做事认知的人用AI,知道自己要去哪
方向是自己定的,AI负责加速。

你让AI帮你做一份市场分析。
如果你自己做过,脑子里有框架。
市场规模、增长率、竞争格局、关键玩家。
给AI的指令会非常精准。

出来的东西不会跑偏。调一调就能用。

没有做事认知的人用AI,像是坐在一辆没有方向盘的车上
AI把你带到了一个地方,看起来挺像那么回事。
但你不知道对不对,该不该在这里下车。

你让AI写一份产品分析报告。
指令大概是"帮我写一份产品分析报告"。
AI给你吐出来一份结构完整、措辞专业的东西。

但你不知道它选的数据源可不可靠。
结论有没有逻辑漏洞。
该不该用这个框架而不是那个框架。

36氪最近翻译了一篇哈佛商业评论的文章。
里面有个发现挺扎心。
一个咨询顾问观察到:AI对资深员工的帮助,远大于对初级分析师的帮助。

初级分析师用AI确实能快速生成内容。
但成果没有实质性提升。
更关键的是,他们往往判断不了产出质量的好坏。

原因不复杂。
判断力不是AI能给你的。
是你自己踩过坑、犯过错、做过决策之后才长出来的。

懂AI才能把AI用快——AI认知的90%

第一块管方向。第二块管速度。

但这里有个关键点很多人没想清楚。
对AI的认知,90%是在提效——同样是干一件事,你懂AI就能快十倍。
剩下10%,是AI能在你已有的方向上,帮你补上你不知道的细节。
这个后面单独说。先说提效这块。

同样一个任务,懂AI和不懂AI的人操作完全不一样。

不懂的人,一句话扔过去,等结果。
结果不好,再换一句话扔过去。
来来回回十几次,时间全耗在对话里了。。。

懂的人,知道要把任务拆成步骤,分阶段让AI执行。
知道什么时候该给上下文,什么时候该给约束条件。

问题是,"懂AI"到底要懂哪些东西?

2026年的AI能力,早就不是一个聊天框了。
如果你还停留在"输入一句话等回复"的阶段,你用的不到AI能力的5%。

老金我把当前主流AI能力分成四层,你看自己到了哪一层。

第一层:对话与生成
这是最基础的。
ChatGPT、Claude、Gemini、豆包、千问、智谱、Minimax等的基本对话能力。
问问题、写文案、翻译、总结。
大部分人停在这一层。

第二层:工具调用
知道AI不只是聊天,还能调用外部工具。
Tool Use(也叫Function Calling)——让AI调用外部API、运行代码、生成图表。
MCP协议——让AI直接读你本地文件、查数据库、调API,不用手动复制粘贴。
RAG(检索增强生成)——把AI连上你的企业知识库,让它基于你的私有数据回答问题。

到这一层,效率已经翻了好几倍。
因为AI从"只能回答问题"变成了"能替你干活"。

第三层:技能与扩展
知道AI可以装"技能包"。
Skills(Agent Skills)——2025年底Anthropic推出的开放标准。
简单说就是可复用的指令包,把专业知识和工作流程打包给AI用。
比如老金我写的公众号写作Skill、代码审查Skill、质量检测Skill。
装上之后,AI不用每次从零学起,直接按专业流程干活。

Plugins——比Skill更高一层的打包方式。
一个Plugin可以包含多个Skill、Hooks(自动触发脚本)和MCP服务器。
装一个Plugin,等于给AI装了一整套能力。
Claude Code、Cursor、Codex都支持。

到这一层,你已经不是在用AI了,你是在组建一个AI团队。

第四层:自主执行
这是2026年最热的一层。
Agent Mode——AI不只回答问题,它能自己规划任务、拆步骤、执行、检查结果。
Computer Use——AI直接控制你的浏览器和桌面,帮你操作软件。
Deep Research——AI自主搜索、综合多源信息,出一份完整调研报告。
Subagents——AI在执行过程中,自动生成专业子Agent处理子任务。
Multi-Agent编排——多个Agent协作,像公司里的部门分工一样。

到这一层,AI已经不是工具了。
它更像一个能自己干活的同事。

四个层级,每升一层,效率翻一个量级。

停在第一层的人,和到达第四层的人。
用的可能是同一个ChatGPT账号。
但效率差距可能是10倍甚至更多。

这笔账很清楚。
同样一个调研任务,停在第一层的人可能要30分钟来回折腾。
到第四层的人3分钟搞定。

不是因为后者更聪明。
是因为后者知道AI有哪些能力,怎么组合着用。

如果对你有帮助,记得关注一波~

垂直方向的细节反哺——AI认知的10%

说完了90%的提效。说剩下那10%。

这10%很容易被忽略,但它很关键。

它是这样一种情况:你知道一个大方向,但对这个方向上的具体细节不了解。
AI能在你已有的方向上,帮你把细节补上。

举个例子。
你做过市场分析,你知道该看"竞争格局"这一栏。
但某个新行业的竞争格局具体长什么样、关键玩家是谁、格局是怎么形成的——这些细节你不知道。

这时候你问AI:"XX行业的竞争格局是什么?头部玩家有哪些?各自的市场份额大概是多少?"

AI帮你把这些垂直方向的细节补上了。

注意,这不是从零开始学一个新领域。
是你已经有了"竞争格局"这个认知框架,AI帮你把框架里的具体内容填满。

反哺认知的前提是:你至少得知道该问什么方向。

如果你连"竞争格局"这个概念都没有,你根本不会想到问这个问题。
AI给你的信息再多,你也不知道该往哪个方向深挖。

这就是为什么第一块认知(做事认知)是基础。
没有做事认知,AI给你的细节再多,你也不知道哪些有用、哪些该忽略。

反哺认知还有一个特点:它往往发生得很安静。
你不是在"学习",你是在"用AI干活"的过程中,顺便把某个细节补上了。
干完活回头看,发现自己对这个领域的理解比干活之前深了一层。

这种增长不显眼,但积累起来很可观。

AI帮你跳过了过程,也跳过了成长

说一个不那么舒服的观察。

很多人以为学会了提示词技巧、装了一堆Skill和Plugin,就是学会了用AI。
其实那些只是第二块认知里的工具层。

更深层的问题在第一块——你自己对要做的事情有没有判断力。

哈佛那篇研究里有句话说得挺准:
"AI既增加了对判断力的需求,同时也在侵蚀孕育判断力的经验土壤。"

换成人话说就是:
你让AI帮你写了十份报告,你没亲手写过一份。
你以为自己学会了写报告。
其实你只学会了审阅报告。

这两件事的认知深度差了十个量级。

真正会写报告的人,知道哪句话该放前面。
知道哪个数据该突出,知道哪种逻辑最容易打动读者。

这些判断力,是亲手写出来、被骂过、改过三遍之后才长出来的。

AI帮你跳过了这个过程。
也帮你跳过了这个成长。

这事不能怪AI,工具该干嘛就干嘛。
但使用工具的人得心里有数:
哪些环节可以让AI代劳,哪些环节必须自己动手。

两个问题,测出你的认知缺口

用AI做完一件事之后,问自己两个问题。

你知道AI给你的结果好不好吗?
如果不知道——你缺做事认知。判断不了产出质量,说明你对这件事本身没有框架。

你能让AI更快更好地完成这个任务吗?
如果不能——你缺AI认知。看看上面四层能力金字塔,找到你停在的层级,往上升一层。

这两个问题对应两块认知。缺哪块补哪块。

做事认知靠实践,没有捷径。
多自己动手,多做决策,多承担后果。

AI认知靠学习。
2026年的AI能力已经远超"聊天框"了。
Skills、Plugins、MCP、RAG、Agent Mode、Subagents。
每一个能力对应一倍甚至几倍的效率提升。
不是看一堆文章就完了,是得自己动手试。

两块都到位了,你会发现AI突然好用了。
不是AI变了,是你变了。

写到这,老金反而觉得最有意思的不是两块认知本身。
而是它们之间的关系:AI越强,对人的要求反而越高。

工具越智能,使用它的人越不能糊涂。
AI能帮你省时间、省力气、省步骤。
但省不了你对事情本身的判断力。

这份判断力,只能自己长。


飞书****开源知识库(实时更新 交流群):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf

Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

相关文章
|
11天前
|
Web App开发 人工智能 IDE
小白速通 Codex App:带录播回放
**文末有录播地址** 早上 9 点,你同时有三件事要干:改一个页面、修一个小 bug、整理一份项目说明。 以前这三件事排在一起,你大概率会先挑一个做,剩下两个往后拖。用 AI 编程以后,情况变了。你可以让不同任务并行跑,自己回来只看结果、看 diff、看哪里需要确认。 这也是我为什么要重点讲 Codex App。 Codex 入口很多,CLI、IDE、Cloud/Web、Mobile 都
小白速通 Codex App:带录播回放
|
1月前
|
人工智能 搜索推荐 程序员
豆包收费68到500,Codex收入7天翻倍,免费AI到头了
上个月翻信用卡账单,发现一个事。 AI相关的月订阅已经悄悄超过2000块了。 Claude,Chatgpt,Gemini,GLM,Minimax,即梦,挨个看了一遍,一个都舍不得停。 每一个都在某个工作流里,真离不开。 我以前觉得AI工具会越来越便宜,最终走向免费。 直到这周看到了两条消息。 ## 企业端在掏真金白银了 OpenAI发了条战报。 GPT-5.5发布一周,A
|
25天前
|
人工智能 程序员 API
Claude Code 的 Agent View,让我看到 AI 编程真正麻烦的地方
这两天 Claude Code 又更新了一个东西,叫 Agent View。 一开始我以为这就是个小功能,后来仔细看完官方文档,感觉这事儿有点东西。 它解决的不是模型会不会写代码的问题。 它解决的是当你同时让几个 AI 去干活时,人到底怎么盯、怎么插手、怎么拍板。 官方变更记录里,Agent View 被放在 Claude Code v2.1.139 里,还是 Research Pre
|
4月前
|
人工智能 编解码 运维
Nano Banana 2 来了,Google 把口喷修图卷上天了!4K 效果称王!
今天凌晨 Google 悄悄上线了 Nano Banana 2 的 Flash 模型。 老金我当时的反应是:又来?上次 Nano Banana 刚出的时候,社区吹得天花乱坠。 抱着"先试试看"的心态,老金我打开了 Gemini。 结果这一试,真的不一样了。 ## 先说 Nano Banana 到底是什么 很多人可能还不知道这玩意儿。 简单说,Nano Banana 是 Google
|
2月前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
42942 72
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
4月前
|
存储 人工智能 开发工具
Claude Code自动记忆来了!配合老金三层记忆系统全开源!加强Plus!
昨天晚上,老金我照例打开 Claude Code 准备写代码。 随便聊了几句项目架构,Claude突然冒出一句: "Based on our previous discussions, this project uses pnpm and TypeScript strict mode." 老金我愣了一下。 上次提到pnpm是三天前的事了,这中间重启了好几次。 打开 ~/.claude/p
|
4月前
|
人工智能 监控 API
Claude Code终于有仪表盘了:3条命令装个HUD,上下文用了多少一眼就知道
老金我最近用Claude Code,遇到一个特别烦的事。 写着写着,突然蹦出来一句"context window is getting full"。 然后AI就开始犯傻了——回答变短、逻辑变乱、之前说好的方案全忘了。 每次遇到这种情况,老金我都想骂人。 问题出在哪? Claude Code的终端界面,压根看不到上下文用了多少。 你只能输入 /context手动查,但谁写代码的时候
12343 9
|
19天前
|
人工智能 IDE 调度
Claude Code还是Codex?老金告你怎么选!
本文用“露营报名页”实例,揭示AI编程的核心不是选工具(Claude Code重现场协作,Codex重委托交付),而是厘清自身角色:许愿型需转任务描述,现场型宜边看边调,派单型要明边界验收,调度型则按任务脏/清/险动态组合。关键在学会“安排AI干活”,而非只会提需求。(239字)
|
人工智能 API
别问谁更强,GPT-5.5和Opus4.7综合对比
本文不比模型“谁更强”,而是聚焦真实开发场景:GPT-5.5擅长短循环任务——查文档、跑命令、修小bug,省去频繁切换;Opus 4.7强在长交付任务——重构、审查、Agent执行,减少中断催促。选型关键不在跑分,而在任务形状。(239字)
|
3月前
|
人工智能 运维 数据可视化
老金靠Claude Code+OpenClaw从零写完中英多Agent学术论文,可我英语没过四级代码不会写
昨晚23点多,论文在Zenodo(学术论文发布平台)上提交成功了。 老金我盯着屏幕,有点不真实。 ​ ![Image](https://ucc.alicdn.com/pic/developer-ecology/p3shvhj26rigq_b5989ef70caa44bd828c5456218c15b4.png) ​ 不是因为论文有多牛。 而是这件事本来不应该发生在我身上。 英语没