小学生泪目Agent开发古诗助手

简介: 本文介绍了如何开发一个帮助小学生背古诗的AI Agent。通过阿里云的百炼大模型平台和千问,实现从需求规划、环境准备到开发与测试的全过程。该Agent不仅能根据主题找古诗、提供作者介绍和练习题,还能生成符合诗意境的图片,使学习更有趣。此外,还展示了如何通过无代码方式在百炼平台上构建智能体应用,简化开发流程。希望这能为学习AI Agent开发提供有益参考。

小学生泪目Agent开发古诗助手


内容介绍:

一、需求阶段

二、环境准备

三、开发阶段

四、无代码方式

 

讲师IT咖啡馆

image.png  

学校放暑假了,看着熊孩子每天上窜下跳,但是怎么拯救他的假期呢?今天我们一起动手做一个AI Agent帮孩子背古诗,顺便学习一下Agent开发。你说他会不会感动地想哭呢?

image.png

自己搭大模型太麻烦,我选择阿里云的百炼大模型平台和千问作为开发基础。


一、需求阶段

image.png

需求阶段,我们先规划功能,大概总结一下,首先我需要AI根据主题找一首古诗,然后给出古诗的作者介绍,读完后要出几道练习题来检验学习效果,最后再生成一张图片,符合这首诗的意境,让学习过程更开心。

image.png


二、环境准备

相关环境的准备,我们要注册和开通百炼,并生成APIkey, 这在后续调用中会使用到。

image.png

接下来在本地安装百炼SDK, 通过pip安装就行,注意python版本要大于3.8,之后跑一个最简单的代码,确认本地开发环境已经ready就可以。


三、开发阶段

接下来进入实际的开发。

image.png

主要使用的是assistants API,如果不太熟悉,可以打开官方API说明页面查找。个人觉得大模型的开发最主要的就是思路和prompt,当然prompt也是一种思路。

image.png  

我们给assistant增加了一个tools(即search),它是官方内置的插件。目前官方提供的插件包括了代码解释器、计算器、图片生成、搜索和function call。测试一下,已可生成古诗,成功迈出了第一步。

image.png

接下来把每个功能点作为assistant实现。后面如果需要扩展也比较方便。

image.png

把几个assistant都实现完后,再增加页面,我们用gradio实现页面,pip安装后,引入就可使用。用最简单的对话机器人的形式实现,可以看一下。

image.png

多个assistant执行会涉及到顺序,这里比较简单,若是复杂场景,可以专门增加一个planner的assistant由它安排和调度assistant的执行顺序。完成基本功能后,再运行看执行效果。

image.png

启动后,可以看到右侧有assistant的执行顺序,assistant会一个一个执行。当前执行的assistant会输出它的执行内容以及执行结果。当所有的任务执行完后,可以看到完整预期的内容。


四、无代码方式

image.png  

除自己写代码的方式外,在百炼平台可以通过无代码的方式完成这些工作。进入平台,在“我的应用”新建一个智能体应用。通过“编辑应用”增加流程,进而让应用执行复杂的多步任务。

image.png

新建流程,进入流程的编辑页面,可通过拖、拉、拽的方式构建流程。我们把刚才代码的内容复现,把刚才的内容复制粘贴。节点间的传递参数可以通过按斜线查看,需要对照ID看是哪个节点的返回参数。

  image.png

流程设计完,可以直接进行测试,确认流程能否正确执行。等它的运行,测试通过后回到刚刚的应用,给应用添加创建好的流程后保存,然后发布该智能体。

image.png

百炼会给出API的调用信息,可在代码中调用于智能体的使用。

image.png

目前有一些不足,流程中不能增加插件节点,希望百炼可以尽快增加这种功能。

以上就是本期的内容,希望对你学习AI agent有所帮助。

相关文章
|
8月前
|
人工智能 自然语言处理 API
用AI Agent做一个法律咨询助手,罗老看了都直呼内行 feat.通义千问大模型&阿里云百炼平台
本视频介绍如何使用通义千问大模型和阿里云百炼平台创建一个法律咨询助手AI Agent。通过简单配置,无需编写代码或训练模型,即可快速实现智能问答功能。演示包括创建应用、配置知识库、上传民法典文档、构建知识索引等步骤。最终,用户可以通过API调用集成此AI Agent到现有系统中,提供专业的法律咨询服务。整个过程简便高效,适合快速搭建专业领域的小助手。
875 22
|
8月前
|
数据格式 Python
如何处理用户输入数据格式验证不通过的情况?
如何处理用户输入数据格式验证不通过的情况?
324 79
|
10月前
|
人工智能 监控 机器人
阿里云开发者社区博文规范及指引
阿里云开发者社区博文规范及指引
2657 20
阿里云开发者社区博文规范及指引
|
8月前
|
Cloud Native 关系型数据库 分布式数据库
让PolarDB更了解您--PolarDB云原生数据库核心功能体验馆
让PolarDB更了解您——PolarDB云原生数据库核心功能体验馆,由阿里云数据库产品事业部负责人宋震分享。内容涵盖PolarDB技术布局、开源进展及体验馆三大部分。技术布局包括云计算加速数据库演进、数据处理需求带来的变革、软硬协同优化等;开源部分介绍了兼容MySQL和PostgreSQL的两款产品;体验馆则通过实际操作让用户直观感受Serverless、无感切换、SQL2Map等功能。
282 7
|
8月前
|
人工智能 Python
【02】做一个精美的打飞机小游戏,python开发小游戏-鹰击长空—优雅草央千澈-持续更新-分享源代码和游戏包供游玩-记录完整开发过程-用做好的素材来完善鹰击长空1.0.1版本
【02】做一个精美的打飞机小游戏,python开发小游戏-鹰击长空—优雅草央千澈-持续更新-分享源代码和游戏包供游玩-记录完整开发过程-用做好的素材来完善鹰击长空1.0.1版本
226 7
|
8月前
|
存储 人工智能 自然语言处理
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
AI Agent以自主性和智能化为核心,适合复杂任务的动态执行;而SaaS工具则注重服务的完整性和易用性,适合标准化业务需求。
504 14
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
|
8月前
|
缓存 网络协议 JavaScript
浏览器输入 URL 后的那些事儿
本文介绍了浏览器输入URL后到页面展示的完整过程,涵盖DNS解析、TCP三次握手、HTTP请求与响应、以及浏览器渲染等关键步骤。首先,浏览器通过DNS解析将域名转换为IP地址;接着,通过TCP三次握手建立连接;随后发送HTTP请求获取网页内容;最后,浏览器解析HTML、CSS并构建渲染树,完成页面渲染。整个过程涉及网络协议和浏览器内部机制的协同工作。
233 13
|
8月前
|
安全 数据库 数据安全/隐私保护
处理用户输入数据格式验证不通过的情况时,如何给出友好的提示信息?
处理用户输入数据格式验证不通过的情况时,如何给出友好的提示信息?
401 78
|
8月前
|
存储 安全 Go
Go语言中的map数据结构是如何实现的?
Go 语言中的 `map` 是基于哈希表实现的键值对数据结构,支持快速查找、插入和删除操作。其原理涉及哈希函数、桶(Bucket)、动态扩容和哈希冲突处理等关键机制,平均时间复杂度为 O(1)。为了确保线程安全,Go 提供了 `sync.Map` 类型,通过分段锁实现并发访问的安全性。示例代码展示了如何使用自定义结构体和切片模拟 `map` 功能,以及如何使用 `sync.Map` 进行线程安全的操作。
221 9
|
8月前
|
SQL 关系型数据库 MySQL
除了使用cursor.execute()和executescript(),还有哪些可以手动进行参数化查询的方法?
除了使用cursor.execute()和executescript(),还有哪些可以手动进行参数化查询的方法?
224 73