小学生泪目Agent开发古诗助手
内容介绍:
一、需求阶段
二、环境准备
三、开发阶段
四、无代码方式
讲师:IT咖啡馆
学校放暑假了,看着熊孩子每天上窜下跳,但是怎么拯救他的假期呢?今天我们一起动手做一个AI Agent帮孩子背古诗,顺便学习一下Agent开发。你说他会不会感动地想哭呢?
自己搭大模型太麻烦,我选择阿里云的百炼大模型平台和千问作为开发基础。
一、需求阶段
需求阶段,我们先规划功能,大概总结一下,首先我需要AI根据主题找一首古诗,然后给出古诗的作者介绍,读完后要出几道练习题来检验学习效果,最后再生成一张图片,符合这首诗的意境,让学习过程更开心。
二、环境准备
相关环境的准备,我们要注册和开通百炼,并生成APIkey, 这在后续调用中会使用到。
接下来在本地安装百炼SDK, 通过pip安装就行,注意python版本要大于3.8,之后跑一个最简单的代码,确认本地开发环境已经ready就可以。
三、开发阶段
接下来进入实际的开发。
主要使用的是assistants API,如果不太熟悉,可以打开官方API说明页面查找。个人觉得大模型的开发最主要的就是思路和prompt,当然prompt也是一种思路。
我们给assistant增加了一个tools(即search),它是官方内置的插件。目前官方提供的插件包括了代码解释器、计算器、图片生成、搜索和function call。测试一下,已可生成古诗,成功迈出了第一步。
接下来把每个功能点作为assistant实现。后面如果需要扩展也比较方便。
把几个assistant都实现完后,再增加页面,我们用gradio实现页面,pip安装后,引入就可使用。用最简单的对话机器人的形式实现,可以看一下。
多个assistant执行会涉及到顺序,这里比较简单,若是复杂场景,可以专门增加一个planner的assistant由它安排和调度assistant的执行顺序。完成基本功能后,再运行看执行效果。
启动后,可以看到右侧有assistant的执行顺序,assistant会一个一个执行。当前执行的assistant会输出它的执行内容以及执行结果。当所有的任务执行完后,可以看到完整预期的内容。
四、无代码方式
除自己写代码的方式外,在百炼平台可以通过无代码的方式完成这些工作。进入平台,在“我的应用”新建一个智能体应用。通过“编辑应用”增加流程,进而让应用执行复杂的多步任务。
新建流程,进入流程的编辑页面,可通过拖、拉、拽的方式构建流程。我们把刚才代码的内容复现,把刚才的内容复制粘贴。节点间的传递参数可以通过按斜线查看,需要对照ID看是哪个节点的返回参数。
流程设计完,可以直接进行测试,确认流程能否正确执行。等它的运行,测试通过后回到刚刚的应用,给应用添加创建好的流程后保存,然后发布该智能体。
百炼会给出API的调用信息,可在代码中调用于智能体的使用。
目前有一些不足,流程中不能增加插件节点,希望百炼可以尽快增加这种功能。
以上就是本期的内容,希望对你学习AI agent有所帮助。