超实用工具分享!Gotenberg,让你的文档转换PDF无缝对接

简介: 超实用工具分享!Gotenberg,让你的文档转换PDF无缝对接

简介

Gotenberg 是一个开源的文档转换服务,使用 ChromiumLibreOffice 支持将多种文档格式(HTMLMarkdownWordExcel 等)转换为PDF

image.png

安装

这里我们使用docker来快速安装与运行gotenberg

docker run --rm -d -p 3000:3000 gotenberg/gotenberg:8

安装完成后,我们可以通过访问 http://localhost:3000 来使用 gotenbergAPI。 实际请求地址请根据服务器ip和使用的端口进行调整。

使用

Gotenberg提供了 HTTP API,你可以通过发送 HTTP 请求来使用它。

下面是GotenbergAPI文档 的一下简单使用示例,更多的API你可以通过访问 官方文档 来进行查看。

image.png

1.网页地址(URL)转PDF

请求路由:

POST /forms/chromium/convert/url

请求参数 multipart/form-data:

参数名 类型 是否必须 说明
url string 要转换的网页地址(URL)地址

示例

curl \
--request POST http://localhost:3000/forms/chromium/convert/url \
--form url=https://my.url \
-o my.pdf

postman 模拟请求结果

image.png

2.HTML转PDF

请求路由:

POST /forms/chromium/convert/html

请求参数 multipart/form-data:

参数名 类型 是否必须 说明
files file index.html文件

注意:上传的 html 名称必须为 index.html

示例

curl \
--request POST http://localhost:3000/forms/chromium/convert/html \
--form files=@/path/to/index.html \
-o my.pdf

postman模拟请求结果

image.png

3.Office文档转换为PDF

请求路由:

POST /forms/libreoffice/convert

请求参数 multipart/form-data:

参数名 类型 是否必须 说明
files file Office文档

示例

curl \
--request POST http://localhost:3000/forms/libreoffice/convert \
--form files=@/path/to/file.docx \
-o my.pdf

postman 模拟请求结果

image.png

总结

Gotenberg 是一个方便的开源工具,用于将各种格式的文档转换为 PDF 。它可以通过 Docker 容器快速安装运行,提供简单的 HTTP API 接口,使得文档转换过程变得简单易用。

你只需要发送相应的 HTTP 请求,就可以将 URLHTMLMarkdownWordPPTExcel 等文件转换为 PDF,并下载转换后的文件。

请注意,具体的安装和使用步骤可能会根据 Gotenberg 的版本和你的系统环境有所不同。

建议参考 Gotenberg 的官方文档以获取最新的安装和使用指南。


相关文章
|
6月前
|
人工智能 文字识别 自然语言处理
熊猫 OCR 识别软件下载,支持截图 OCR、PDF 识别、多语言翻译的免费全能工具,熊猫OCR识别
本文介绍了几款实用的图文识别软件,包括熊猫OCR、Umi-OCR和天若OCR_本地版。熊猫OCR功能强大,支持多窗口操作、AI找图找色、OCR识别等;Umi-OCR免费且高效,具备截图OCR、批量处理等功能;天若OCR界面简洁,适合快速文字识别。文章还提供了下载链接及软件特点、界面展示等内容,便于用户根据需求选择合适的工具。
631 36
|
8月前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
2380 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
7月前
|
人工智能 自然语言处理 安全
CodeBuddy 开发本地 PDF 转图工具
市场上的 PDF 转图片工具存在收费昂贵、功能有限、隐私安全风险等痛点,而使用 CodeBuddy 实现的本地 PDF 批量转图片工具可以有效解决这些问题。CodeBuddy 的强大编程能力让我们可以快速开发出满足需求的工具,而且工具可以在本地运行,保证了文件的隐私安全。此外,工具还支持批量处理和自定义功能,提高了工作效率。如果你也有 PDF 转图片的需求,不妨尝试使用 CodeBuddy 来实现一个属于自己的工具。
254 11
|
7月前
|
人工智能 算法 安全
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
374 10
|
10月前
|
人工智能 文字识别 安全
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具,支持 50 多种 PDF 操作,包括合并、拆分、转换、压缩等,同时提供多语言支持和企业级功能,满足个人和企业用户的多样化需求。
903 6
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
|
11月前
|
人工智能 文字识别 自然语言处理
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
Vision Parse 是一款开源的 PDF 转 Markdown 工具,基于视觉语言模型,能够智能识别和提取 PDF 中的文本和表格,并保持原有格式和结构。
1517 19
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
|
11月前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
1108 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
9月前
|
文字识别 BI API
3.4K star!全能PDF处理神器开源!文档转换/OCR识别一键搞定
PDF-Guru 是一款开箱即用的全能型PDF处理工具,支持跨平台文档转换、智能OCR识别、多格式解析等核心功能。项目采用模块化架构设计,提供简洁的Web界面和API接口,开发者可快速集成到现有系统中。
774 1
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
2710 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
机器学习/深度学习 人工智能 自然语言处理
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
Documind 是一款利用 AI 技术从 PDF 中提取结构化数据的先进文档处理工具,支持灵活的本地或云端部署。
603 8
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据