超实用工具分享!Gotenberg,让你的文档转换PDF无缝对接

简介: 超实用工具分享!Gotenberg,让你的文档转换PDF无缝对接

简介

Gotenberg 是一个开源的文档转换服务,使用 ChromiumLibreOffice 支持将多种文档格式(HTMLMarkdownWordExcel 等)转换为PDF

image.png

安装

这里我们使用docker来快速安装与运行gotenberg

docker run --rm -d -p 3000:3000 gotenberg/gotenberg:8

安装完成后,我们可以通过访问 http://localhost:3000 来使用 gotenbergAPI。 实际请求地址请根据服务器ip和使用的端口进行调整。

使用

Gotenberg提供了 HTTP API,你可以通过发送 HTTP 请求来使用它。

下面是GotenbergAPI文档 的一下简单使用示例,更多的API你可以通过访问 官方文档 来进行查看。

image.png

1.网页地址(URL)转PDF

请求路由:

POST /forms/chromium/convert/url

请求参数 multipart/form-data:

参数名 类型 是否必须 说明
url string 要转换的网页地址(URL)地址

示例

curl \
--request POST http://localhost:3000/forms/chromium/convert/url \
--form url=https://my.url \
-o my.pdf

postman 模拟请求结果

image.png

2.HTML转PDF

请求路由:

POST /forms/chromium/convert/html

请求参数 multipart/form-data:

参数名 类型 是否必须 说明
files file index.html文件

注意:上传的 html 名称必须为 index.html

示例

curl \
--request POST http://localhost:3000/forms/chromium/convert/html \
--form files=@/path/to/index.html \
-o my.pdf

postman模拟请求结果

image.png

3.Office文档转换为PDF

请求路由:

POST /forms/libreoffice/convert

请求参数 multipart/form-data:

参数名 类型 是否必须 说明
files file Office文档

示例

curl \
--request POST http://localhost:3000/forms/libreoffice/convert \
--form files=@/path/to/file.docx \
-o my.pdf

postman 模拟请求结果

image.png

总结

Gotenberg 是一个方便的开源工具,用于将各种格式的文档转换为 PDF 。它可以通过 Docker 容器快速安装运行,提供简单的 HTTP API 接口,使得文档转换过程变得简单易用。

你只需要发送相应的 HTTP 请求,就可以将 URLHTMLMarkdownWordPPTExcel 等文件转换为 PDF,并下载转换后的文件。

请注意,具体的安装和使用步骤可能会根据 Gotenberg 的版本和你的系统环境有所不同。

建议参考 Gotenberg 的官方文档以获取最新的安装和使用指南。


相关文章
|
26天前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
101 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
1月前
|
人工智能 文字识别 自然语言处理
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
Vision Parse 是一款开源的 PDF 转 Markdown 工具,基于视觉语言模型,能够智能识别和提取 PDF 中的文本和表格,并保持原有格式和结构。
157 19
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
|
2月前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
320 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
2月前
|
XML C# 数据格式
一个.NET开源、免费、功能强大的 PDF 处理工具
一个.NET开源、免费、功能强大的 PDF 处理工具
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
Documind 是一款利用 AI 技术从 PDF 中提取结构化数据的先进文档处理工具,支持灵活的本地或云端部署。
146 8
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
|
4月前
|
Java BI API
spring boot 整合 itextpdf 导出 PDF,写入大文本,写入HTML代码,分析当下导出PDF的几个工具
这篇文章介绍了如何在Spring Boot项目中整合iTextPDF库来导出PDF文件,包括写入大文本和HTML代码,并分析了几种常用的Java PDF导出工具。
896 0
spring boot 整合 itextpdf 导出 PDF,写入大文本,写入HTML代码,分析当下导出PDF的几个工具
|
4月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
4月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
1225 1
|
6月前
|
Python
还不会免费将PDF转为Word?你可以试试这3种工具!
还不会免费将PDF转为Word?你可以试试这3种工具!
160 0
|
7月前
|
JSON 测试技术 数据安全/隐私保护
【Docker项目实战篇】Docker部署PDF多功能工具Stirling-PDF
【7月更文挑战第7天】Docker部署PDF多功能工具Stirling-PDF
472 2

热门文章

最新文章