JAVA基于PDF box将PDF转为图片

简介: JAVA基于PDF box将PDF转为图片在一项目中用到,本身我是。NET的,团队中有用到JAVA,故此我处理这个功能,记录以下备用。1.引用:fontbox-2.0.16.jar、pdfbox-app-2.0.16.jar 版本一定要正确,否则代码会有问题。

JAVA基于PDF box将PDF转为图片
在一项目中用到,本身我是。NET的,团队中有用到JAVA,故此我处理这个功能,记录以下备用。

1.引用:fontbox-2.0.16.jar、pdfbox-app-2.0.16.jar 版本一定要正确,否则代码会有问题。

main函数:

package kevin.cn;
import java.awt.image.BufferedImage;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import javax.imageio.ImageIO;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.encryption.InvalidPasswordException;
import org.apache.pdfbox.rendering.ImageType;
import org.apache.pdfbox.rendering.PDFRenderer;
import org.apache.pdfbox.tools.PDFBox;

import kevin.cn.PdfUtil;
@SuppressWarnings("unused")
public class Test {

//经过测试,dpi为96,100,105,120,150,200中,105显示效果较为清晰,体积稳定,dpi越高图片体积越大,一般电脑显示分辨率为96
public static final float DEFAULT_DPI = 105;
//默认转换的图片格式为jpg
public static final String DEFAULT_FORMAT = "jpg";
public static void main(String[] args) throws Exception {
    pdfToImage("/media/kevin/FileData/JavaCode/pdfboxTest/企业信息化建设论文.pdf","/media/kevin/FileData/JavaCode/pdfboxTest/img/7.jpg",5);
}

  实现函数:

/**

 * pdf转图片
 *
 * @param pdfPath PDF路径
 * @imgPath img路径
 * @page_end 要转换的页码,也可以定义开始页码和结束页码,我这里只需要一页,根据需求自行添加
 */
public static void pdfToImage(String pdfPath, String imgPath,int page_end) {
    try {
        //图像合并使用参数
        // 总宽度
        int width = 0;
        // 保存一张图片中的RGB数据
        int[] singleImgRGB;
        int shiftHeight = 0;
        //保存每张图片的像素值
        BufferedImage imageResult = null;
        //利用PdfBox生成图像
        PDDocument pdDocument = PDDocument.load(new File(pdfPath));
        PDFRenderer renderer = new PDFRenderer(pdDocument);
        //循环每个页码
        for (int i = 0, len = pdDocument.getNumberOfPages(); i < len; i++) {
            if (i==page_end) {
                BufferedImage image = renderer.renderImageWithDPI(i, DEFAULT_DPI, ImageType.RGB);
                int imageHeight = image.getHeight();
                int imageWidth = image.getWidth();
               //计算高度和偏移量
                //使用第一张图片宽度;
                width = imageWidth;
                //保存每页图片的像素值
                imageResult = new BufferedImage(width, imageHeight, BufferedImage.TYPE_INT_RGB);
                //这里有高度,可以将imageHeight*len,我这里值提取一页所以不需要
                  singleImgRGB = image.getRGB(0, 0, width, imageHeight, null, 0, width);
                  // 写入流中
                  imageResult.setRGB(0, shiftHeight, width, imageHeight, singleImgRGB, 0, width);
            }else if(i>page_end) {
                continue;
            }
           
             
        }

        pdDocument.close();
        // 写图片
        ImageIO.write(imageResult, DEFAULT_FORMAT, new File(imgPath));
         
    } catch (Exception e) {
       
        e.printStackTrace();
    }
    //OVER
}
相关文章
|
1月前
|
Java
java通过commons-fileupload实现多张图片的上传(servlet)
java通过commons-fileupload实现多张图片的上传(servlet)
23 2
|
1月前
|
数据挖掘 数据安全/隐私保护 开发者
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
74 0
|
1月前
|
存储 Java 计算机视觉
Java代码居然可以做出如此高级的图片编辑系统
Java代码居然可以做出如此高级的图片编辑系统
29 0
|
2月前
|
Java
java Itext创建pdf
java Itext创建pdf
31 0
|
1月前
|
前端开发 Java
java通过commons-fileupload实现多张图片的上传(jsp页面)
java通过commons-fileupload实现多张图片的上传(jsp页面)
16 2
|
2月前
|
编解码 数据可视化 数据挖掘
【办公自动化】用Python将PDF文件转存为图片
【办公自动化】用Python将PDF文件转存为图片
64 1
|
1月前
|
Java
java中复制图片
java中复制图片
10 2
|
1月前
|
机器学习/深度学习 文字识别 数据安全/隐私保护
Python实现从PDF和图片提取文字的方法总结
Python实现从PDF和图片提取文字的方法总结
53 0
|
1月前
|
存储 Java Apache
java 读取图片成二进制流
【2月更文挑战第10天】
|
2月前
|
文字识别 Java
Java使用Tess4j识别图片里的文字
Java使用Tess4j识别图片里的文字

热门文章

最新文章