前阵子看到一个数字,不知道该说离谱还是意料之中。
微软一个核心业务部门,给几千名工程师开通了 Claude Code,打算靠 AI 把开发效率拉起来。结果四个月后财务拉账单,全年 AI 算力预算已经归零。实际支出超预期三倍以上。没有审批漏洞,没有恶意刷量。就是几千人正常用,没设额度上限。
工程圈讨论的角度各有不同。有人算架构账,有人聊管理责任。但有一个问题几乎没人从技术侧追问:这四个月的预算烧完了,团队的知识库多了什么?
代码也许有一些,但大部分和 AI 的交互不是最终产物,是过程。一段反复调试的 Prompt、一套跑通后被忘记的 Skill 配置、一份调了十几轮才稳定的 Memory。这些东西在哪?在那个工程师的 Claude 个人账号里。他离职那天,它们跟着账号一起走了。
三样东西,没有仓库可放
企业的数字化资产大多有明确的存放位置。代码进 Git,文档进 Confluence,设计稿进 Figma,客户数据进 CRM。每类资产都有路径、有权限、有交接流程。
AI 时代的产出物是个例外。
一个运营同事花两周调试出一套 Prompt,能把竞品分析的时间从三小时压到二十分钟。这套 Prompt 在哪?大概率在她的 AI 工具聊天记录里。一个后端工程师写了一套 Skill,能自动跑完代码审查并输出结构化意见。配置在哪?本地某个 JSON 文件里,和项目代码混在一起,没有任何版本管理。还有一个产品经理,几个月让 AI 记住了团队命名规范、接口风格、用户画像偏好。这套 Memory 是上百次对话喂出来的。换个人接手,AI 对这些背景一无所知,Memory 得从头再训。
换个角度看,这是一种知识蒸馏。只是对象不是模型,是人。
优秀员工和普通员工的差距,很多时候不是知识面,是判断力。知道这个场景该用哪个模型、Prompt 怎么写才能一次出对、Skill 怎么编排才高效、路由策略怎么做成本和效果最划算。这些东西在过去很难被提取,因为是隐性经验,在脑子里。但现在不一样了。这个人把经验写进了 Prompt,封装进了 Skill,喂进了 Memory。每一段调试过的指令,本质上就是专业判断的浓缩。
问题在于:蒸馏完的产物,团队没接住。它留在了个人账号里。
成本不可见,资产就不可管
如果产出物留不住是第一个问题,那第二个问题是:很多团队压根不知道钱花在哪。
月初充值的额度,月底还剩多少,这是最常见的粒度。哪个项目消耗最大?哪个调用最频繁?有没有人拿顶配模型跑简单的文本摘要?不清楚。
传统采购和报销体系面对「按 Token 计费、调用量按秒波动」的 AI 服务,天然对不上口径。一张月底账单最多看到总数,看不到明细,更看不到谁在哪个场景上消耗了哪部分预算。偶尔拉一次账还能应付。但当 AI 调用变成日常行为,当多个项目、多个模型并发运行时,手工对账就彻底失灵。
回头看微软那个案例,「没设额度上限」只是表象。更深的问题是:消费没有实时跟踪,成本没有归因到使用者和业务场景,预算消耗速度没有人能提前感知。等财务拉账单,已经晚了。
在云时代,FinOps 的思路已经成熟。以阿里云 AI 网关新上线的 FinOps 能力为例,通过消费者配额将 Token 消耗前置到调用链路中,按使用者、按业务线拆分用量,让每一笔消耗「看得见、管得住」。这套逻辑在 AI 调用场景下同样适用:在请求发出前带上身份标签,在请求完成的瞬间完成记账。越往后挪,信息损失越大,归因越模糊。
从技术视角看:一条可落地的链路
如果要在团队内部构建这样一套治理机制,技术上需要解决三个层面的问题。
第一层,身份注入。 调用链路的入口处需要将使用者身份、所属项目、调用意图等元信息注入请求上下文。这一步可以在 API 网关层完成——无论底层模型是阿里云的通义千问还是其他 Provider,网关统一签发带身份标签的派生凭证,后续所有环节基于此凭证进行追踪。
第二层,实时计量。 每次调用在返回结果的同时完成 Token 计数和成本估算,写入时序存储。这里的关键设计是将「账单口径」(事后对账)和「估算口径」(实时监控)分开维护。估算口径允许少量误差,但延迟必须控制在秒级;账单口径追求精确,可以 T+1 对齐 Provider 的结算数据。
第三层,策略执行。 基于前两层的身份和计量数据,可以在调用链路中插入策略点:预算阈值告警、单用户日消耗上限、低成本模型自动降级、异常激增自动熔断。这些策略不需要侵入业务代码,作为网关中间件即可实现。
更重要的是,这三层架构天然具备资产沉淀的基础。当每一次 Prompt 调用、每一次 Skill 编排、每一次 Memory 写入都被记录和归因时,「谁创造了什么、它是否有效、被复用了多少次」就不再是一个需要事后手工收集的问题,而是系统运行的自然产物。
企业为 AI 花的钱,能不能不只换来月底一张账单?当 Prompt、Skill、Memory 像代码一样被入库和版本管理,当人走了经验还在,当每一笔投入的产出可追溯、可复用——这才是 AI 时代企业真正需要补齐的那块拼图。