pdf文件转化为png照片 (PyMuPDF下面的fitz)

简介: pdf文件转化为png照片 (PyMuPDF下面的fitz)

1.本篇给大家封装了一个函数,用来将pdf转化为png图片,可以转化全部,也可以转化单页;

代码如下:

import fitz
import os

def pyMuPDF_fitz(pdfPath, imagePath, num, all=True):
    """
    :param pdfPath: pdf文件路径
    :param imagePath: 图片存放目录
    :param num: 第几页,索引从0开始
    :param all: 是否转化所有页面
    :return:
    """
    pdfDoc = fitz.open(pdfPath)
    if all:
        start = 0
        end = pdfDoc.pageCount
    else:
        start = num
        end = num+1
    for i in range(start,end):
        page = pdfDoc[i]
        rotate = int(0)
        zoom_xy = (1.3333,1.3333)
        mat = fitz.Matrix(zoom_xy[0],zoom_xy[1]).prerotate(rotate)
        pix = page.getPixmap(matrix=mat,alpha=False)
        if not os.path.exists(imagePath):
            os.makedirs(imagePath)
        pix.writePNG(f"{imagePath}{i}.png")

pdfPath = 'E://a.pdf'
imagePath = 'E://'
pyMuPDF_fitz(pdfPath, imagePath ,0,False)

View Code

2.此模块可以直接裁剪图片,然后转成字节类型

pdf_doc = fitz.Document(stream=pdf_req, filetype="pdf")
    page = pdf_doc[num]
    mat = fitz.Matrix(zoom_x, zoom_y).preRotate(0)
    clip = fitz.Rect(Point(coordinate[0] / k_y, coordinate[1] / k_x), Point(coordinate[2] / k_y, coordinate[3] / k_x))
    pix = page.getPixmap(matrix=mat, clip=clip)
    img_bytes = pix.getImageData()
    return BytesIO(img_bytes)
相关文章
|
3月前
|
XML 缓存 JSON
为什么浏览器中有些图片、PDF等文件点击后有些是预览,有些是下载
为什么浏览器中有些图片、PDF等文件点击后有些是预览,有些是下载
251 0
|
29天前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
29天前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
135 1
|
1月前
|
索引 Python
PDF文件页面提取操作小指南
PDF文件页面提取操作小指南
|
1月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
|
1月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件
|
1月前
|
JSON 数据格式
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
69 2
|
1月前
|
人工智能 计算机视觉 Python
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
ChatGPT编程省钱、方便小示例——实现PDF转成PNG文件
|
1月前
|
存储 安全 网络安全
Python编程--使用PyPDF解析PDF文件中的元数据
Python编程--使用PyPDF解析PDF文件中的元数据
|
30天前
|
JavaScript 前端开发 容器
Vue生成PDF文件攻略:html2canvas与jspdf联手,中文乱码与自动换行难题攻克
Vue生成PDF文件攻略:html2canvas与jspdf联手,中文乱码与自动换行难题攻克
78 0