老金开源GoalPro,别让AI把目标越写越烂

简介: GoalPro是专为Codex与Claude Code设计的开源Goal Skill,通过「意图-边界-证据-暂停-验收」五重闸门,帮开发者生成可执行、可验证、可暂停的目标契约(Goal Contract),防止AI在长任务中跑偏。非自动执行工具,专注把目标权交还人类。

Image

Goal这个词最近确实火。Claude Code和Codex里都有了,官方文档也把它放在长任务、迁移、重构、实验这类场景里讲。

它的意思很清楚,给AI一个能持续对照的目标,别让它每一步都靠人重新提醒。

但问题也在这。很多人一听goal重要,立刻把它写成一段超级长的提示词。角色、背景、步骤、约束、验收、风险全塞进去。看着专业,复制进去以后,AI也显得很认真。

然后它开始一路认真地跑偏。你本来只想修一个问题,它开始整理全仓库。你本来只想重构一小块,它开始抽象架构。你本来只想让它写个目标,它已经准备继续改文件了。

这就是我开源GoalPro的原因。Github地址:github.com/KimYx0207

Image

如果你觉得这个项目有用,也麻烦点个Star,顺手转给身边正在用Codex或Claude Code的人。

开源项目能不能持续迭代,很多时候就靠这些真实反馈和传播。

对的,了解我的都知道我所有开源项目,都围绕着我的核心开源项目 Meta_Kim 进行制作的。已经有很多小伙伴使用后做完应用来着老金报喜了,甚至有小伙伴在拿这套项目在写成书,已经七八十页了,可见其内容丰富度了。

简单点儿说,其他我开源的仓库,在Meta_Kim面前,根本不够看一点儿,而且 Meta_Kim 是做任何事情都能使用的万能基座,所以中文名,我才起名为 “元”。

先装起来,别先背概念

GoalPro是一个给Codex和Claude Code共用的goalpro Skill。Skill可以先理解成一套能被AI调用的工作方法,它不是普通模板,也不是执行工具,是执行前把目标写清楚的规则。

它同时支持两套目录。Codex看 .agents/skills/goalpro,Claude Code看 .claude/skills/goalpro。你可以装到用户全局skills目录,也可以放进某个项目里,只给这个项目用。

最省事的方式,是直接让AI帮你装。复制这一句就够:

请帮我把GoalPro安装到这台电脑的Codex和Claude Code全局skills里。
项目地址是github.com/KimYx0207/GoalPro。
先确认当前系统和工作目录,如果仓库还没下载就从GitHub获取,然后把.agents/skills/goalpro复制到用户目录下的.agents/skills/goalpro,把.claude/skills/goalpro复制到用户目录下的.claude/skills/goalpro。
最后读取两个SKILL.md开头,确认name是goalpro,并告诉我安装结果。

如果你想手动装,Win和Mac分开看,别混着抄。

Windows用PowerShell:

git clone https://github.com/KimYx0207/GoalPro.git
cd GoalPro

New-Item-ItemType Directory -Force"$env:USERPROFILE\.agents\skills" | Out-Null
Copy-Item-Recurse-Force".agents\skills\goalpro""$env:USERPROFILE\.agents\skills\goalpro"

New-Item-ItemType Directory -Force"$env:USERPROFILE\.claude\skills" | Out-Null
Copy-Item-Recurse-Force".claude\skills\goalpro" "$env:USERPROFILE\.claude\skills\goalpro"

Mac和Linux用Bash:

git clone https://github.com/KimYx0207/GoalPro.git
cd GoalPro

mkdir -p ~/.agents/skills ~/.claude/skills
cp -R .agents/skills/goalpro ~/.agents/skills/goalpro
cp -R .claude/skills/goalpro ~/.claude/skills/goalpro

如果你只是想在某个项目里试,就不用装到全局。把 .agents/skills/goalpro放进目标项目给Codex用,把 .claude/skills/goalpro放进目标项目给Claude Code用。

这里不用把命令想复杂。你真正要记住的是,GoalPro装进去以后,它的任务不是替你干活,而是先把活说清楚。

技术含量在五个闸门里

GoalPro不是把提示词写长。它真正做的是给AI动手前加五个闸门。

Image

第一个是意图。
用户说优化项目,背后可能是不满意可维护性,也可能是不满意交付可信度,还可能是前一个AI已经跑偏。GoalPro不能复述用户原话,它要把真实不满翻出来。

第二个是边界。
哪些做,哪些不做,哪些文件不能碰,哪些风险必须问人。没有边界,AI会把自己的合理扩展当成你的需求。

第三个是证据。
命令通过、结构检查、本地验证、线上验证、人工验收,这几件事不能混在一起。很多假完成,就是把其中一个当成全部。

第四个是暂停。
遇到删除数据、处理密钥、改公共接口、发布上线、路线互斥、无法验证,它必须停。这个停不是软建议,是写进目标里的规则。

第五个是验收。
最后不是汇报我努力了,而是交出能证明目标达成的材料。测试、截图、diff、行为变化、剩余风险,都要和用户最初的目标对上。

我最看重的是第三和第四。因为AI现在最吓人的地方,不是它懒,是它太勤快。方向一旦歪,它会非常认真地把错误做完整。

如果对你有帮助,记得关注一波~

用起来,其实是一条很短的路径

装完以后,你可以这样问:

用goalpro,帮我把下面这个请求整理成可执行、可验证、可暂停的Goal Contract:

把订单模块重构一下,现在太乱了。

GoalPro会输出一份Goal Contract。你确认没问题,再把它交给Codex的/goal、Claude Code或其他Agent执行。

比如类似这样,放个图能让大家感受明确,但这图有点儿长 - -

Image

注意这个顺序。GoalPro默认 只输出可复制的goal提示词,然后停住,这是我的强制规定,人该检查的时候不能偷懒。

它不会因为目标里写了Execution policy、Verification、Checkpoints,就继续替你改文件。用户没有明确说按这个goal执行,它就不能执行。

Image

我故意设计的prompt-only闸门。Skill mention不等于执行授权。你说goalpro,它就写目标。你说按这个目标执行,它才进入下一轮执行任务。

这个边界看起来有点保守,但真实项目里很有用。

因为很多失控不是从大错误开始的,而是从一句顺手的我来继续开始的。

为什么我不把它做成自动执行工具

有人可能会问,既然GoalPro能写得这么清楚,为什么不顺手执行?

我想了很久,最后还是把它卡住了。

因为目标生成和任务执行是两件事。目标生成阶段,最怕的是越权。执行阶段,最怕的是没有目标。把两件事混在一起,体验上确实省一步,但边界会变糊。

GoalPro的默认交付物是一段可复制的goal提示词。它写完就停。你可以复制到Codex的/goal里,也可以发给Claude Code,也可以交给另一个Agent。只有你明确授权,它才进入新的执行任务。

好的goal要有清楚的完成条件、验证方式和停止规则,适合那些比一条prompt更长、但又不能无限发散的任务。

AI越来越能干以后,人最容易偷懒的地方,不是把步骤交给AI,而是把目标也交给AI。GoalPro干的事,就是把这个目标重新拿回人手里。

谁该用,谁没必要用

小任务别上GoalPro。改一个错别字、查一个文件名、补一句文案,直接让AI做就行。流程太重,会拖慢你。

但只要任务会跨文件、跨模块、影响发布、牵涉外部事实、需要研究判断,或者你自己都觉得这事容易跑偏,就该先写Goal Contract。

它特别适合三类人。

一类是经常用Codex或Claude Code做项目的人。你不缺AI能力,缺的是让AI少乱跑的边界。

一类是做内容、方案、课程、产品文档的人。你不一定每天写代码,但你会把大任务交给AI,这时候更需要先讲清验收。

还有一类,是已经被AI长任务折磨过的人。你看着它很努力,最后却不知道它到底完成了什么。GoalPro就是给这种场景准备的。

最后留一句

这两年我越来越少相信万能提示词。

万能提示词最容易让人产生错觉,以为只要写得够全,AI就会按人的意思走。真实情况更粗糙一点。目标没写对,提示词越全,跑偏越稳。

GoalPro不是让AI少干活。

它是让AI先确认,自己到底在替谁、为了什么、按什么证据干活。

人负责目标、判断、取舍和验收。AI负责搜索、生成、执行和检查。最后要的不是模型自己觉得合理的结果,而是符合人类目标的结果。

这个边界如果守不住,再强的Agent也只是跑得更快。

跑得更快,有时候不是进步。

是更难追回来。


飞书****开源知识库(实时更新 交流群):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

相关文章
|
11天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
11天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
844 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
11天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
854 7
|
11天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
11天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2300 5
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
11天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
1877 6
|
11天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
785 150
|
11天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
633 2