PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: PPTAgent 是中科院推出的自动生成演示文稿框架,基于两阶段编辑方法,支持智能分析、大纲生成、幻灯片生成与评估,适用于教育、企业培训等多种场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 功能:PPTAgent 支持从文档自动生成高质量演示文稿,涵盖大纲生成、幻灯片设计与内容评估。
  2. 技术:基于两阶段编辑方法,结合大型语言模型(LLM)实现智能分析与迭代优化。
  3. 应用:适用于教育、企业培训、市场营销等多个领域,提升演示文稿生成效率与质量。

正文(附运行示例)

PPTAgent 是什么

PPTagent-advanced

PPTAgent 是由中国科学院软件研究所中文信息处理实验室推出的创新框架,旨在通过模仿人类工作流程的两阶段编辑方法,从文档自动生成高质量的演示文稿。该框架通过分析参考演示文稿,提取结构模式和内容模式,并基于代码动作草拟大纲并生成幻灯片,确保内容的一致性和对齐。

PPTAgent 基于大型语言模型(LLM)的能力,将演示文稿生成过程分解为迭代的编辑工作流程,从而提高生成演示文稿的连贯性和适应性。此外,PPTAgent 还引入了 PPT Eval 评估框架,从内容、设计和连贯性三个维度全面评估生成的演示文稿质量,为未来的演示文稿生成研究提供宝贵的资源和见解。

PPTAgent 的主要功能

  • 分析参考演示文稿:理解其结构模式和内容模式。
  • 草拟大纲:基于分析结果,创建详细的演示文稿大纲。
  • 生成幻灯片:基于代码动作,将大纲转化为具体的幻灯片内容,确保内容的一致性和对齐。
  • 编辑和修正:提供反馈机制,对生成的幻灯片进行编辑和自我修正,提高生成文稿的质量。
  • 综合评估:基于 PPT Eval 框架,从内容、设计和连贯性三个维度评估生成的演示文稿质量。

PPTAgent 的技术原理

  • 第一阶段:演示文稿分析

    • 幻灯片聚类:将幻灯片分为结构幻灯片和内容幻灯片,分别通过 LLM 和层次聚类方法进行分析。
    • 模式提取:利用 LLM 的情境感知能力,提取多样化的内容模式,确保编辑的目的性。
  • 第二阶段:演示文稿生成

    • 大纲生成:指导 LLM 创建结构化大纲,结合文档内容和参考演示文稿的语义信息。
    • 幻灯片生成:在大纲指导下,基于迭代编辑参考幻灯片生成新幻灯片,并通过 API 支持文本和视觉元素的编辑。

如何运行 PPTAgent

运行该项目一般需要以下几个步骤,确保你已经安装了 Node.js 和 npm(或 yarn)。以下是详细的步骤:

1. 安装 Node.js 和 npm(如未安装)

Vue 项目依赖于 Node.js 环境。如果你还没有安装 Node.js,可以访问 Node.js 官网 下载并安装适合你操作系统的版本。npm 会随 Node.js 一起安装。

2. 克隆该项目到本地运行环境

git clone https://github.com/icip-cas/PPTAgent.git

3. 进入项目目录

进入到项目web_ui目录。例如:

cd PPTAgent/pptagent_ui

4. 安装依赖

在项目目录下运行以下命令来安装项目所需的依赖包:

npm install
# 或者使用 yarn
# yarn install

5. 运行开发服务器

安装完依赖后,你可以通过以下命令启动开发服务器:

npm run serve
# 或者使用 yarn
# yarn serve

这将启动一个本地开发服务器,默认情况下会在 http://localhost:8080 提供项目。你可以通过浏览器访问这个地址来查看你的 Vue 应用。

如何使用 PPTAgent 评估生成的 PPT

1. 安装依赖

pip install -r requirements.txt
sudo apt install libreoffice
sudo apt install poppler-utils

2. 生成演示文稿

python rebuild.py rebuild_all --out_filename "final.pptx"

3. 将 PPT 转换为图片

python evals.py pptx2images

4. 评估演示文稿

python evals.py eval_experiment -s 0 -j 0

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
4天前
|
人工智能 Linux iOS开发
exo:22.1K Star!一个能让任何人利用日常设备构建AI集群的强大工具,组成一个虚拟GPU在多台设备上并行运行模型
exo 是一款由 exo labs 维护的开源项目,能够让你利用家中的日常设备(如 iPhone、iPad、Android、Mac 和 Linux)构建强大的 AI 集群,支持多种大模型和分布式推理。
201 100
|
5天前
|
机器学习/深度学习 人工智能 编解码
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构,支持多种推理求解器,能生成高质量、多风格的图像。
93 17
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
|
2天前
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
229 7
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
4天前
|
人工智能 开发框架 数据可视化
Eino:字节跳动开源基于Golang的AI应用开发框架,组件化设计助力构建AI应用
Eino 是字节跳动开源的大模型应用开发框架,帮助开发者高效构建基于大模型的 AI 应用。支持组件化设计、流式处理和可视化开发工具。
101 27
|
2天前
|
存储 人工智能 NoSQL
Airweave:快速集成应用数据打造AI知识库的开源平台,支持多源整合和自动同步数据
Airweave 是一个开源工具,能够将应用程序的数据同步到图数据库和向量数据库中,实现智能代理检索。它支持无代码集成、多租户支持和自动同步等功能。
44 14
|
3天前
|
存储 人工智能 API
ChatGPT-on-WeChat:Star32.4k, DeepSeek加持!这款开源神器秒变AI助手,聊天体验直接起飞!
嗨,大家好,我是小华同学。今天为大家介绍一款结合DeepSeek引擎的开源项目——ChatGPT-on-WeChat,由开发者zhayujie打造。它将微信变成智能AI助手,支持文本、图片、语音对话,具备定时提醒、天气查询等扩展功能,完全开源且易于定制。项目地址:https://github.com/zhayujie/chatgpt-on-wechat。关注我们,获取更多优质开源项目和高效学习方法。
73 11
|
1天前
|
人工智能 JSON 搜索推荐
猫步简历 - 开源免费AI简历生成器 | 一键导出PDF/JSON
猫步简历是一款免费开源的AI简历生成器,帮助用户轻松创建独特、专业的简历。支持导出超高清PDF、图片、JSON等多种格式,并提供AI智能创作、润色和多语种切换等功能。拥有海量模板、高度定制化模块及完善的后台管理系统,助力求职者脱颖而出。官网:https://maobucv.com,GitHub开源地址:https://github.com/Hacker233/resume-design。
43 9
|
5天前
|
人工智能 安全 开发工具
Repomix:8.1K Star!轻松将整个代码库打包为AI友好格式的开源工具,使代码库更易于AI理解
Repomix 是一款强大的工具,能够将整个代码库打包成AI友好的单个文件,支持多种输出格式和安全检查。
56 9
|
4天前
|
人工智能 关系型数据库 分布式数据库
PolarDB 开源基础教程系列 7.4 应用实践之 AI大模型外脑
PolarDB向量数据库插件通过实现通义大模型AI的外脑,解决了通用大模型无法触达私有知识库和产生幻觉的问题。该插件允许用户将新发现的知识和未训练的私有知识分段并转换为向量,存储在向量数据库中,并创建索引以加速相似搜索。当用户提问时,系统将问题向量化并与数据库中的向量进行匹配,找到最相似的内容发送给大模型,从而提高回答的准确性和相关性。此外,PolarDB支持多种编程语言接口,如Python,使数据库具备内置AI能力,极大提升了数据处理和分析的效率。
26 4
|
机器学习/深度学习 人工智能 文字识别

热门文章

最新文章