Agent实操(四):Code Interpreter,生成二维码、视频、PDF转txt等炸裂功能

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 本文介绍Agent自带的Code Interpreter有哪些高级而实用的能力

在介绍了零代码创建agent,以及低代码调用APItool创建高阶agent,今天,我们来讲讲Agent自带的Code Interpreter有哪些高级而实用的能力。介绍之前我们先看看它到底是什么。


Code Interpreter(代码解释器)是什么?


简单来说,它赋予了语言模型运行Python代码的能力,用户只需用自然语言告诉模型任务是什么,模型就能编写相对应的Python代码并执行,来解决任务。

作为Agent的内置工具,当Agent会写代码又会执行代码,想象力的边界将被无限扩展,即使不会代码也能让大模型+代码高效快捷地完成我们想要的工作。


Code Interpreter(代码解释器)可以做什么?


Code Interpreter(代码解释器)可以做什么?

  • 生成二维码,将链接地址秒转二维码图片
  • 图片处理,如图片分割并转gif
  • 文件类型转换,如pdf转txt
  • 视频生成,将图片生成视频
  • 数据分析及可视化,excel技能拉满
  • 数学计算,解答高级数学问题
  • 等等……

甚至可以作为自定义API调用的controller,只有你想不到没有做不到!


应用案例


Agent配置示例



Agent构建的推荐Prompt

Name: Python编程专家

Description: 使用python解决任务时,你可以运行代码并得到结果,如果运行结果有错误,你需要尽可能对代码进行改进。你可以处理用户上传到电脑的文件。

Instructions:

1.你会数学解题;

2. 你会数据分析和可视化;

3. 你会转化文件格式,生成视频等;

4.用户上传文件时,你必须先了解文件内容再进行下一步操作;如果没有上传文件但要求画图,则编造示例数据画图;

5.调用工具前你需要说明理由;Think step by step;

6. 代码出错时你需要反思并改进。


注意在configure中勾选上code interpreter


功能演示

1、生成二维码


2、文件类型转换:pdf转txt

Ps:目前魔搭的创空间gradio版本无法直接展示txt、gif、视频等文件格式,建议在本地或者云端体验,可以在日志中找到对应的文件并下载查看。


3、图片处理

输入:

输出:

屏幕录制2023-12-01 上午8.37.17 00_00_00-00_00_30.gif


完整链路视频

截图+gif生成 00_00_00-00_00_30.gif


4、视频生成

输入图片

输出视频

r0.gif

5、数据可视化


6、数据分析


7、图表生成

8、编程教学


9、高级数学计算

不使用工具纯文本计算数学题容易出错:


使用Code Interpreter计算后答案正确:



Agent大本营,可以看到开发者创建的有趣agents

https://www.modelscope.cn/brand/view/agent


也欢迎加入钉钉群交流:



点击查看魔搭Agent品牌馆~


https://www.modelscope.cn/brand/view/agent

相关文章
|
28天前
实现将信息作为txt,pdf,图片的形式保存到电脑~
实现将信息作为txt,pdf,图片的形式保存到电脑~
iframe 在线预览pdf、word、excel、ppt、txt、图片、视频
iframe 在线预览pdf、word、excel、ppt、txt、图片、视频
|
2月前
|
自然语言处理 API 开发者
Agent实操(五):如何在本地/云端创建并发布更定制化的Agent
利于模型的微调优化,工具的本地部署,魔改代码
Agent实操(五):如何在本地/云端创建并发布更定制化的Agent
|
2月前
|
数据可视化 测试技术 API
Modelscope Agent实操(三):将API注册为tool,成为smart API,方便社区开发者调用
大家通过写python代码的方式来定制自己的tool,进一步扩展Agent的能力。
|
2月前
|
JSON 搜索推荐 API
Modelscope Agent实操(二):低代码调用API创建更加酷炫的Agent
上一篇中介绍了 0代码创建、发布并分享一个专属Agent,今天主要介绍如何借助API让你的Agent更加有用、有趣!
|
2月前
|
API 开发者
Modelscope Agent实操(一):0代码创建、发布并分享一个专属Agent
在前一段时间,魔搭社区推出了开源版GPTs,期望未来让大家能更轻松地搭建Agent。
|
7月前
|
前端开发 C#
C# 基于NPOI+Office COM组件 实现20行代码在线预览文档(word,excel,pdf,txt,png)
C# 基于NPOI+Office COM组件 实现20行代码在线预览文档(word,excel,pdf,txt,png)
|
9月前
遍历所有文件夹寻找指定格式的数据(遍历所有文件夹及子文件找到相应的.xls .mp4 .pdf .txt .jpg)
遍历所有文件夹寻找指定格式的数据(遍历所有文件夹及子文件找到相应的.xls .mp4 .pdf .txt .jpg)
78 0
|
JSON 自然语言处理 数据可视化
如何用Elasticsearch实现Word、PDF,TXT文件的全文内容检索?
如何用Elasticsearch实现Word、PDF,TXT文件的全文内容检索?
如何用Elasticsearch实现Word、PDF,TXT文件的全文内容检索?

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 视觉智能开放平台