有关文件转pdf的代码示例

简介: 有关文件转pdf的代码示例
工作中 经常会遇到文件在线预览的问题,如果仅仅是预览的话,可以通过技术手段,将文件统一转化为pdf,然后使用浏览器针对pdf的预览功能即可。

开始看代码

1 、引入坐标依赖
<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.24</version>
</dependency>
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>4.1.2</version>
</dependency>
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>4.1.2</version>
</dependency>
<dependency>
    <groupId>fr.opensagres.xdocreport</groupId>
    <artifactId>org.apache.poi.xwpf.converter.pdf</artifactId>
    <version>2.0.2</version>
</dependency>
2 、代码实现
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageContentStream;
import org.apache.pdfbox.pdmodel.common.PDRectangle;
import org.apache.pdfbox.rendering.PDFRenderer;
import org.apache.pdfbox.tools.PDFToImage;
import org.apache.pdfbox.tools.imageio.ImageIOUtil;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.converter.PDFConverter;
import org.apache.poi.hwpf.usermodel.Range;
import org.apache.poi.xwpf.converter.pdf.PdfConverter;
import org.apache.poi.xwpf.converter.pdf.PdfOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
public class FileToPdfConverter {
    public static void main(String[] args) {
        try {
            // 读入需要转换的文件
            File inputFile = new File("input.doc");
            FileInputStream inStream = new FileInputStream(inputFile);
            // 创建pdf输出文件
            File outputFile = new File("output.pdf");
            FileOutputStream outStream = new FileOutputStream(outputFile);
            // 创建pdf文档
            PDDocument document = new PDDocument();
            // 根据文件类型选择转换方法
            if (inputFile.getName().endsWith(".doc")) {
                // 将doc文件转换为pdf文件
                HWPFDocument doc = new HWPFDocument(inStream);
                Range range = doc.getRange();
                PdfConverter.getInstance().convert(range, document);
            } else if (inputFile.getName().endsWith(".docx")) {
                // 将docx文件转换为pdf文件
                XWPFDocument doc = new XWPFDocument(inStream);
                PdfOptions options = PdfOptions.create();
                PdfConverter.getInstance().convert(doc, document, options);
            } else if (inputFile.getName().endsWith(".txt")) {
                // 将txt文件转换为pdf文件
                PDPage page = new PDPage(PDRectangle.A4);
                document.addPage(page);
                PDPageContentStream contentStream = new PDPageContentStream(document, page);
                FileInputStream inputStream = new FileInputStream(inputFile);
                int data = inputStream.read();
                while(data != -1) {
                    contentStream.beginText();
                    contentStream.showText(String.valueOf((char)data));
                    contentStream.endText();
                    contentStream.newLineAtOffset(0, -12);
                    data = inputStream.read();
                }
                inputStream.close();
                contentStream.close();
            } else if (inputFile.getName().endsWith(".jpg") || inputFile.getName().endsWith(".jpeg") || inputFile.getName().endsWith(".png")) {
                // 将图片文件转换为pdf文件
                PDPage page = new PDPage();
                document.addPage(page);
                PDFRenderer renderer = new PDFRenderer(document);
                PDFToImage pdfToImage = new PDFToImage();
                pdfToImage.setImageType("png");
                pdfToImage.setOutputPrefix("tmp");
                pdfToImage.setPdfFile(inputFile.getAbsolutePath());
                pdfToImage.startConversion(renderer, 1, 1);
                File tmpFile = new File("tmp-1.png");
                ImageIOUtil.writeImage(renderer.renderImage(0), "tmp-1.png", 300);
                PDPageContentStream contentStream = new PDPageContentStream(document, page);
                contentStream.drawImage(PDImageXObject.createFromFile(tmpFile.getAbsolutePath(), document), 0, 0, PDRectangle.A4.getWidth(), PDRectangle.A4.getHeight());
                contentStream.close();
                tmpFile.delete();
            } else {
                System.out.println("不支持的文件类型");
                return;
            }
            // 保存pdf文件并关闭输入输出流
            document.save(outStream);
            document.close();
            inStream.close();
            outStream.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}
相关文章
|
18天前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
115 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
21天前
|
JavaScript
jquery图片和pdf文件预览插件
EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。
48 16
|
3月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
3月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
715 1
|
3月前
|
Java BI API
spring boot 整合 itextpdf 导出 PDF,写入大文本,写入HTML代码,分析当下导出PDF的几个工具
这篇文章介绍了如何在Spring Boot项目中整合iTextPDF库来导出PDF文件,包括写入大文本和HTML代码,并分析了几种常用的Java PDF导出工具。
720 0
spring boot 整合 itextpdf 导出 PDF,写入大文本,写入HTML代码,分析当下导出PDF的几个工具
|
3月前
|
索引 Python
PDF文件页面提取操作小指南
PDF文件页面提取操作小指南
106 4
|
3月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
54 3
|
3月前
|
Python
EasyGUI+PyDF2应用小示例—PDF页面提取应用程序
EasyGUI+PyDF2应用小示例—PDF页面提取应用程序
36 3
|
3月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件
47 1
|
3月前
|
人工智能 计算机视觉 Python
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
42 1