Agent实操(四):Code Interpreter,生成二维码、视频、PDF转txt等炸裂功能

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 本文介绍Agent自带的Code Interpreter有哪些高级而实用的能力

在介绍了零代码创建agent,以及低代码调用APItool创建高阶agent,今天,我们来讲讲Agent自带的Code Interpreter有哪些高级而实用的能力。介绍之前我们先看看它到底是什么。


Code Interpreter(代码解释器)是什么?


简单来说,它赋予了语言模型运行Python代码的能力,用户只需用自然语言告诉模型任务是什么,模型就能编写相对应的Python代码并执行,来解决任务。

作为Agent的内置工具,当Agent会写代码又会执行代码,想象力的边界将被无限扩展,即使不会代码也能让大模型+代码高效快捷地完成我们想要的工作。


Code Interpreter(代码解释器)可以做什么?


Code Interpreter(代码解释器)可以做什么?

  • 生成二维码,将链接地址秒转二维码图片
  • 图片处理,如图片分割并转gif
  • 文件类型转换,如pdf转txt
  • 视频生成,将图片生成视频
  • 数据分析及可视化,excel技能拉满
  • 数学计算,解答高级数学问题
  • 等等……

甚至可以作为自定义API调用的controller,只有你想不到没有做不到!


应用案例


Agent配置示例



Agent构建的推荐Prompt

Name: Python编程专家

Description: 使用python解决任务时,你可以运行代码并得到结果,如果运行结果有错误,你需要尽可能对代码进行改进。你可以处理用户上传到电脑的文件。

Instructions:

1.你会数学解题;

2. 你会数据分析和可视化;

3. 你会转化文件格式,生成视频等;

4.用户上传文件时,你必须先了解文件内容再进行下一步操作;如果没有上传文件但要求画图,则编造示例数据画图;

5.调用工具前你需要说明理由;Think step by step;

6. 代码出错时你需要反思并改进。


注意在configure中勾选上code interpreter


功能演示

1、生成二维码


2、文件类型转换:pdf转txt

Ps:目前魔搭的创空间gradio版本无法直接展示txt、gif、视频等文件格式,建议在本地或者云端体验,可以在日志中找到对应的文件并下载查看。


3、图片处理

输入:

输出:

屏幕录制2023-12-01 上午8.37.17 00_00_00-00_00_30.gif


完整链路视频

截图+gif生成 00_00_00-00_00_30.gif


4、视频生成

输入图片

输出视频

r0.gif

5、数据可视化


6、数据分析


7、图表生成

8、编程教学


9、高级数学计算

不使用工具纯文本计算数学题容易出错:


使用Code Interpreter计算后答案正确:



Agent大本营,可以看到开发者创建的有趣agents

https://www.modelscope.cn/brand/view/agent


也欢迎加入钉钉群交流:



点击查看魔搭Agent品牌馆~


https://www.modelscope.cn/brand/view/agent

相关文章
|
7月前
实现将信息作为txt,pdf,图片的形式保存到电脑~
实现将信息作为txt,pdf,图片的形式保存到电脑~
|
7月前
|
存储
若依框架 --- pdf文件上传预览功能实现
若依框架 --- pdf文件上传预览功能实现
378 0
|
7月前
|
存储
Vue3 实现 PDF 文件在线预览功能
Vue3 实现 PDF 文件在线预览功能
1548 0
iframe 在线预览pdf、word、excel、ppt、txt、图片、视频
iframe 在线预览pdf、word、excel、ppt、txt、图片、视频
|
16天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
75 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
4月前
|
存储 人工智能
|
15天前
|
人工智能 API 数据库
Qwen-Agent功能调用实践探索
本文详细解析了Qwen-Agent的核心功能——功能调用,涵盖其定义、工作流程、重要性和实际应用,通过实例展示了如何在Qwen-Agent中利用此功能与外部工具和API互动,扩展AI应用范围。
|
1月前
|
机器学习/深度学习 人工智能 算法
视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化
斯坦福大学Percy Liang团队推出VideoAgent,一种能生成高质量视频并自我优化的模型。它结合强化学习和监督学习,根据用户反馈和环境变化自动调整,提升视频生成质量和用户体验,但同时也面临模型不稳定性和高资源需求等挑战。
35 6
|
4月前
|
开发框架 前端开发 JavaScript
在Winform分页控件中集成导出PDF文档的功能
在Winform分页控件中集成导出PDF文档的功能
|
5月前
|
JSON 测试技术 数据安全/隐私保护
【Docker项目实战篇】Docker部署PDF多功能工具Stirling-PDF
【7月更文挑战第7天】Docker部署PDF多功能工具Stirling-PDF
412 2

热门文章

最新文章