Skills实战:从0到1封装一个“登录鉴权”Skill,拿来即用

简介: 本文直击AI Agent落地痛点——登录鉴权失效、状态丢失、提示词不可靠。提出以“Skill”替代传统提示词工程:将动态认证逻辑(如Token获取/刷新/存储)封装为可复用、带状态管理的代码模块,实现跨会话稳定调用。实战拆解Skill四要素,揭示其如何让AI“一次登录,全程无忧”。

很多人已经开始感觉到,2024年AI Agent的热潮退去之后,剩下的不是泡沫,而是一地没解决的问题。

最典型的一个场景:你花了三天时间调教出来的AI助手,换个系统就废了。让它登录一下企业内部系统,它说“请提供用户名密码”。你给了,下一次对话它又忘了。你写了一段提示词告诉它怎么处理token刷新,它在长对话里开始混淆上下文。

这不是大模型不行,是你的工程化手段没跟上。

行业里最近在密集讨论一个东西——Skills。OpenAI、Anthropic、国内几家头部AI公司都在推。有人把它叫“AI的能力插件”,有人说是“提示词的工程化封装”。叫什么不重要,重要的是:这个东西正在改变AI落地的游戏规则。

今天不聊概念,直接动手。从一个几乎所有系统都绕不开的场景——登录鉴权,把Skill从0到1做出来。

目录
一、现象:你的AI助手为什么连登录都搞不定
二、本质变化:能力封装正在取代提示词工程
三、核心机制拆解:一个Skill到底长什么样
四、典型案例对比:有Skill和没Skill,差在哪
五、工程落地启示:现在不做什么会后悔
六、结尾:一个绕不开的问题

一、现象:你的AI助手为什么连登录都搞不定
先看一个真实场景。

你让AI助手帮你查询一下CRM系统里今天的客户订单。你给了它账号密码。它说登录成功。然后你问“帮我看看订单A的状态”,它开始胡说八道,因为它根本没拿到真实的订单数据,只是假装登录了。

你换了一种方式,在提示词里写死了curl命令,带上了cookie。这次能用了。但换了测试环境,cookie失效了。你把新的cookie写进去,又得重新改一遍提示词。

再复杂一点,系统用了OAuth2.0。你开始崩溃了。

这不是你一个人的问题。我见过超过30个团队在做内部AI应用时,卡在同一个地方:AI不知道怎么做有状态的操作。每一次对话对AI来说基本都是独立的,它记不住上次拿到的token,也不知道什么时候该刷新。

很多人尝试用提示词解决。写了一大段“请记住你登录后的token,后续请求必须在header里带上Authorization: Bearer xxx”。结果token过期了,AI不知道发生了什么,只会回复“看起来出现了认证问题,请您重新登录”。

根本原因是:提示词是静态的,而系统交互是动态的。

二、本质变化:能力封装正在取代提示词工程
过去一年,大家比拼的是谁写的提示词更长、更细、更像代码。有人把提示词写到了两万字,里面包含了“如果出现403错误,请尝试重新登录”这样的分支逻辑。

这本质上是在用自然语言模拟编程语言。效率低,且不可靠。LLM对精确逻辑的执行能力天然弱于代码。

Skills的思路完全不同:把AI不擅长的事情抽出来,用代码实现,然后给AI一个调用入口。

登录鉴权这件事,核心逻辑是什么?是拿凭证换token、是token过期后自动刷新、是处理各种认证错误。这些逻辑用代码写,三五十行就能搞得很健壮。用提示词写,写到三千字该出错还是出错。

所以Skill的本质不是“更好的提示词”,而是给AI挂载了一个可执行的工具函数。AI负责理解用户意图、决定何时调用这个工具、把调用结果翻译成自然语言。工具本身负责执行精确的操作。

这样一来,AI不需要记住你的token,不需要理解OAuth2.0的授权码流程,不需要知道怎么处理refresh_token。它只需要知道“有个工具叫login,传给我用户名密码,我调它”。

这就是能力封装对提示词工程的替代:把逻辑还给代码,把理解留给模型。

三、核心机制拆解:一个Skill到底长什么样
直接上代码结构。一个标准的登录鉴权Skill包含四个部分:

入口定义:Skill叫什么名字,需要哪些参数。比如用户名、密码、可选的环境标识。

执行函数:真正干活的代码。发送登录请求、解析响应、提取token。

状态管理:把拿到的token存起来,后续请求能取到。同时跟踪过期时间。

错误处理:登录失败怎么办、token过期怎么自动续、网络超时怎么重试。

画一个流程图,看清楚Skill的工作方式:

0b383307-f494-4a15-aaca-8c6743ef0773.png

核心在于状态存储。很多实现把token存在内存变量里,对话一轮结束就丢了。正确做法是把token存在Skill的上下文中,跨对话轮次保持。还要存issued_at和expires_in,下次调用时先判断要不要刷新。

另一个关键设计是“静默刷新”。用户发起一个需要认证的请求,Skill发现token还有30秒过期,这时不应该返回“token快过期了请重新登录”,而应该自动用refresh_token换新的。用户无感知。

怎么做:在Skill内部维护一个ensure_valid_token函数,每次真实请求前先调用。这个函数检查token状态,还有效就直接返回,快过期了刷新,彻底失效了才要求用户重新登录。

四、典型案例对比:有Skill和没Skill,差在哪
拿一个实际场景对比。假设我们要做一个AI助手,能查询公司工单系统里的数据。系统用了JWT,有效期2小时。

没有Skill的做法:

用户在对话里输入账号密码。AI说“好的,已记住”。接下来每一次查询,AI都要在自己的上下文中翻找之前埋下的token。如果对话太长,token信息被挤出去了,AI就说“请重新提供登录信息”。用户疯了。

更糟的是,2小时后token过期。AI不知道这个概念,只会发现请求返回401。它可能会说“看起来系统拒绝了您的请求,可能是权限不足”。用户又得手动解释“因为token过期了,请你重新登录”。

有Skill的做法:

用户说“登录工单系统”,AI调用Login Skill传参。Skill发出请求拿到JWT,存下来,记录过期时间。AI回复“登录成功”。

2小时后用户问“查询工单#1234”。AI再次调用工单查询的Skill,这个Skill内部先调用Login Skill的ensure_valid_token。Login Skill发现token已过期,自动用refresh_token换新,拿到新token后继续执行查询。整个过程用户不知道发生了token刷新。

体验差异:前者对话随时会断,用户需要理解认证机制。后者用户只需要登录一次,后面全自动。

Skill解决的从来不是“能不能做到”,而是“能不能稳定做到、能不能让用户无感”。

五、工程落地启示:现在不做什么会后悔
第一个启示:别再往提示词里塞逻辑了。

我看到有人把整个状态机的逻辑写进提示词,用自然语言描述“当前状态是logged_in,下一步如果收到401应该切换到refreshing”。这条路走到黑就是死胡同。LLM不是状态机引擎。

第二个启示:Skill的设计要围绕“失效边界”。

登录鉴权里,token会失效、会话会过期、网络会抖动。一个健壮的Skill必须定义清楚:什么情况下自动恢复,什么情况下需要用户介入。自动恢复的部分尽量多,用户介入的部分尽量少。

第三个启示:Skill之间可以组合。

登录鉴权Skill不应该单独存在。更合理的架构是:有一个底层的HTTP请求Skill,它内置了认证能力;其他所有需要联网的Skill都通过它来发请求。这样登录逻辑只写一次,所有Skill共享。

对初入行的测试来说,这是理解“分层设计”的好机会。对中级工程师,这是重构现有AI应用架构的切入点。

对在校生,看懂这个方向,你就知道为什么现在企业在招“AI工程化”岗位,而不是“提示词工程师”。

六、结尾:一个绕不开的问题
上面讲的这套东西,用了不到200行代码就能实现一个可用的版本。

但有一个问题我想了很久,也没找到标准答案,今天抛出来:

当Skill越来越多(几十个甚至上百个),AI如何准确判断用户意图对应哪个Skill?尤其是当多个Skill的输入参数和功能描述高度相似时,靠提示词里的描述来区分,边界在哪里?

你现在的团队里,如果有人提了一个“做一个万能登录Skill”的需求,你会怎么判断这个Skill的职责边界?是做一个通用的支持所有认证协议的Super Skill,还是拆成BasicAuthSkill、OAuthSkill、JwtSkill各自独立?

相关文章
|
20小时前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
7504 32
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
20小时前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
643 142
|
20小时前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
|
20小时前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1262 2
|
20小时前
|
人工智能 弹性计算 运维
阿里云发布堡垒机智能运维Agent,运维交互进入自然语言新时代
支持自然语言运维,提升效率与安全双保障。
1168 1
|
20小时前
|
存储 定位技术 数据库
CodeGraph 如何让 Claude Code减少 7 成工具调用?
CodeGraph 为 Coding Agent 提供本地代码知识图谱,把函数、类、调用链和框架路由提前整理成“项目地图”,减少盲目搜索和文件读取。它不是新 Agent,而是上下文基础设施,让 Agent 更快找到正确代码路径,平均减少 7 成工具调用。
1315 4
|
20小时前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
394 4
|
20小时前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
340 1
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
20小时前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
20小时前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
461 1