使用 XDocReport 将 .docx 文件转换为 .pdf 文件

简介: 本文介绍如何使用 XDocReport 库在 Java 中将 Word 文件转换为 PDF 文件

docx转换为pdf网上有很多技术解决方案,本文介绍另外一种,
如何使用 XDocReport 库在 Java 中将 Word 文件转换为 PDF 文件;

将 XDocReport 转换器 DOCX XWPF 依赖添加到 Java 项目

如果您使用 Gradle 构建项目,请将以下依赖项添加到 build.gradle 文件中。

implementation group: 'fr.opensagres.xdocreport', name: 'fr.opensagres.xdocreport.converter.docx.xwpf', version: '2.0.3'

如果您使用 Maven 构建项目,请将以下依赖项添加到 pom.xml 文件中

···xml

<groupId>fr.opensagres.xdocreport</groupId>
<artifactId>fr.opensagres.xdocreport.converter.docx.xwpf</artifactId>
<version>2.0.3</version>

···

如何在 Java 中将 .docx 文件转换为 .pdf 文件

在 Java 中,对于给定的 Word 文件,我们可以使用 XDocReport API 通过以下步骤将其转换为 PDF 文件。

第 1 步:使用 FileInputStream 将 .docx 文件作为 InputStream 打开。
第 2 步:使用 XWPFDocument(InputStream is) 构造函数创建新的 XWPFDocument 对象。
第 3 步:使用 PdfOptions.create() 静态方法创建 PdfOptions 的新实例。
第 4 步:使用 FileOutputStream 将 .pdf 文件写入 OutputStream。
第 5 步:使用 PdfConverter.getInstance().convert(XWPFDocument document, OutputStream out, T options) 方法将 .docx 文件转换为 .pdf 文件。
在下面的 FileConverter Java 类中,我们通过上述步骤实现了一个方法,将 .docx 文件转换为具有给定文件名的 .pdf 文件。

FileConverter.java



import fr.opensagres.poi.xwpf.converter.pdf.PdfConverter;
import fr.opensagres.poi.xwpf.converter.pdf.PdfOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.FileNotFoundException;
import java.io.InputStream;
import java.io.IOException;
import java.io.OutputStream;

public class FileConverter {

    public void convertWordToPdf(String docxFileName, String pdfFileName) {
        try(InputStream inputStream = new FileInputStream(docxFileName);
            OutputStream outputStream = new FileOutputStream(pdfFileName)) {
            XWPFDocument document = new XWPFDocument(inputStream);
            PdfOptions options = PdfOptions.create();
            // Convert .docx file to .pdf file
            PdfConverter.getInstance().convert(document, outputStream, options);
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}


···
# 如何使用 FileConverter 类将 Word 转换为 PDF 文件

例如,我们有一个位于 D:\SimpleSolution\Data\Document.docx 的示例 Word 文件,其内容如下图所示。
![image.png](https://ucc.alicdn.com/pic/developer-ecology/cf85435d326e45cca5ceb30208881976.png)

Java 使用 XDocReport 将 .docx 文件转换为 .pdf 文件

在下面的示例 Java 程序中,我们使用上一步中的 FileConverter 类将上面的示例 Word 文件转换为 PDF 文件。

ConvertDocxToPdfExample1.java

执行 Java 应用程序,我们在 D:\SimpleSolution\Data\Document.pdf 生成 PDF 文件,如下图所示。
![image.png](https://ucc.alicdn.com/pic/developer-ecology/1fec116160d54c0ebb1b4e6b00ee958f.png)
相关文章
|
2月前
|
数据挖掘 数据安全/隐私保护 开发者
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
107 0
|
2月前
|
存储 缓存 Python
如何使用Python抓取PDF文件并自动下载到本地
如何使用Python抓取PDF文件并自动下载到本地
34 0
|
2月前
|
JSON JavaScript 前端开发
vue项目使用Print.js插件实现PDF文件打印
vue项目使用Print.js插件实现PDF文件打印
63 0
|
2月前
|
Linux 数据安全/隐私保护 iOS开发
使用pdf2docx轻松将PDF转换成docx
使用pdf2docx轻松将PDF转换成docx
48 0
|
2月前
|
Shell Python
Python生成PDF文件
Python生成PDF文件
25 0
|
2月前
|
前端开发
前端实现生成pdf文件并下载
前端实现生成pdf文件并下载
39 1
|
3月前
|
Java Linux 数据安全/隐私保护
Java【代码 16】将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理
【2月更文挑战第3天】Java 将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理
107 0
|
4月前
|
Java API Apache
使用 Apache PDFBox 操作PDF文件
Apache PDFBox库是一个开源的Java工具,专门用于处理PDF文档。它允许用户创建全新的PDF文件,编辑现有的PDF文档,以及从PDF文件中提取内容。此外,Apache PDFBox还提供了一些命令行实用工具。
108 6
|
4月前
|
存储
Vue3 实现 PDF 文件在线预览功能
Vue3 实现 PDF 文件在线预览功能
324 0
|
5月前
|
JavaScript 前端开发
nodejs实现解析chm文件列表,无需转换为PDF文件格式,在线预览chm文件以及目录,不依赖任何网页端插件
nodejs实现解析chm文件列表,无需转换为PDF文件格式,在线预览chm文件以及目录,不依赖任何网页端插件