文档备案控制台

开发者社区开发与运维文章正文

Python——批量将PDF文件转为图片

2024-08-13 282

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python——批量将PDF文件转为图片

前言

这里是只将pdf文件的前两页进行了转换;

内容

import fitz  # pip install pymupdf
import os
def pdf2img(pdf_path, zoom_x, zoom_y):
    doc = fitz.open(pdf_path) 
    for page in doc: 
        print(page.number)
        pic = page.get_pixmap(matrix=fitz.Matrix(zoom_x, zoom_y)) 
        dir_save = os.path.dirname(pdf_path) 
        pdf_name = os.path.basename(pdf_path).split('.pdf')[0]
        pic.save(f'{dir_save}/{pdf_name}-page-{page.number + 1}.png') 
        if page.number == 1: 
            break
    doc.close()
for root, dirs, files in os.walk(r"C:\Users\WangYang\Desktop\资料"):
    for file in files:
        if os.path.splitext(file)[1] == '.pdf':
            # print(file)
            pdf2img(
                os.path.join(root, file),
                zoom_x=3,
                zoom_y=3
            )

学无止境,谦卑而行.

文章标签：

Python

关键词：

Python文件

Python图片

Python PDF

PDF图片

PDF文件

。思索

目录

相关文章

蒋星熠Jaxonic

|

9月前

|

监控机器人编译器

如何将python代码打包成exe文件---PyInstaller打包之神

PyInstaller可将Python程序打包为独立可执行文件，无需用户安装Python环境。它自动分析代码依赖，整合解释器、库及资源，支持一键生成exe，方便分发。使用pip安装后，通过简单命令即可完成打包，适合各类项目部署。

蒋星熠Jaxonic

1579 68 69

一个程序员

|

10月前

|

机器学习/深度学习编解码 Python

Python图片上采样工具 - RealESRGANer

Real-ESRGAN基于深度学习实现图像超分辨率放大，有效改善传统PIL缩放的模糊问题。支持多种模型版本，推荐使用魔搭社区提供的预训练模型，适用于将小图高质量放大至大图，放大倍率越低效果越佳。

一个程序员

813 3 3

站大爷

|

10月前

|

机器学习/深度学习文字识别 Java

Python实现PDF图片OCR识别：从原理到实战的全流程解析

本文详解2025年Python实现扫描PDF文本提取的四大OCR方案（Tesseract、EasyOCR、PaddleOCR、OCRmyPDF），涵盖环境配置、图像预处理、核心识别与性能优化，结合财务票据、古籍数字化等实战场景，助力高效构建自动化文档处理系统。

站大爷

2671 0 1

站大爷

|

10月前

|

数据可视化 Linux iOS开发

Python脚本转EXE文件实战指南：从原理到操作全解析

本教程详解如何将Python脚本打包为EXE文件，涵盖PyInstaller、auto-py-to-exe和cx_Freeze三种工具，包含实战案例与常见问题解决方案，助你轻松发布独立运行的Python程序。

站大爷

2304 2 3

站大爷

|

11月前

|

缓存数据可视化 Linux

Python文件/目录比较实战：排除特定类型的实用技巧

本文通过四个实战案例，详解如何使用Python比较目录差异并灵活排除特定文件，涵盖基础比较、大文件处理、跨平台适配与可视化报告生成，助力开发者高效完成目录同步与数据校验任务。

站大爷

343 0 0

程序员晚枫

|

11月前

|

程序员数据安全/隐私保护 Python

1行Python代码，实现PDF的加密、解密

程序员晚枫分享使用python-office库实现PDF批量加密与解密的新方法。只需一行代码，即可完成单个或多个PDF文件的加密、解密操作，支持文件路径与正则筛选，适合自动化办公需求。更新至最新版，适配性更佳，操作更简单。

程序员晚枫

425 8 8

1行Python代码，实现PDF的加密、解密

云流雨洄

|

11月前

|

安全 JavaScript 开发者

Python 自动化办公神器｜一键转换所有文档为 PDF

本文介绍一个自动化批量将 Word、Excel、PPT、TXT、HTML 及图片转换为 PDF 的 Python 脚本。支持多格式识别、错误处理与日志记录，适用于文档归档、报告整理等场景，大幅提升办公效率。仅限 Windows 平台，需安装 Office 及相关依赖。

云流雨洄

580 0 0

bruce_xiaowei

|

存储安全网络安全

Python编程--使用PyPDF解析PDF文件中的元数据

Python编程--使用PyPDF解析PDF文件中的元数据

bruce_xiaowei

808 1 1

小空门123-30335

|

Unix Linux Shell

Sphinx是一个Python文档生成工具，它可以解析reStructuredText或Markdown格式的源代码注释，并生成多种输出格式，如HTML、LaTeX、PDF、ePub等。

Sphinx是一个Python文档生成工具，它可以解析reStructuredText或Markdown格式的源代码注释，并生成多种输出格式，如HTML、LaTeX、PDF、ePub等。

小空门123-30335

948 0 0

cxhuan

|

存储对象存储 Python

第107天： Python 解析 PDF

第107天： Python 解析 PDF

cxhuan

1270 0 0

第107天： Python 解析 PDF

热门文章

最新文章

下载python所有的包国内地址

使用Python的pandas和matplotlib库绘制移动平均线（MA）示例

Python爬虫day3.2—python异常处理

如何使用Python和Flask构建一个简单的RESTful API。Flask是一个轻量级的Web框架

折线图应用场景 | Python 数据可视化库 Matplotlib 快速入门之十二

python4--作业

【Python 基础教程 05】超详细解析Python3注释：全面入门教程，初学者必读,了解Python如何进行注释

python的继承

python3.5 beautiful4.4 扣扣国内新闻爬虫

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

深度剖析：PDF 工具箱功能，编辑器操作及页面 / 图像提取技巧

Python实现PDF图片OCR识别：从原理到实战的全流程解析

公众号如何添加附传Word、Excel、Pdf、PPT文档

公募REITs公告PDF文档处理项目

LangChain默认工具正在污染你的知识库！PDF解析崩溃真相

基于iTextSharp实现PDF加密功能

Python 自动化办公神器｜一键转换所有文档为 PDF

Python实现Word转PDF全攻略：从入门到实战

05百融云策略引擎项目交付-laravel实战完整交付定义常量分文件配置-独立建立lib类处理-成功导出pdf-优雅草卓伊凡

相关课程

更多

高校精品课-华东师范大学 - Python数据科学基础与实践

【科技少年】Python基础语法

【科技少年】Python绘画编程第一课

面向运维的 python 脚本速成-1024程序员节创造营公益课

Python 脚本入门

Python 脚本进阶

相关电子书

更多

阿里云产品手册（2021版）

飞天大数据&AI产品手册

阿里云数据安全和隐私保护白皮书

推荐镜像

更多

python-release

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！