开发者社区开发与运维文章正文

Python——批量将PDF文件转为图片

2024-08-13 65

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python——批量将PDF文件转为图片

前言

这里是只将pdf文件的前两页进行了转换;

内容

import fitz  # pip install pymupdf
import os
def pdf2img(pdf_path, zoom_x, zoom_y):
    doc = fitz.open(pdf_path) 
    for page in doc: 
        print(page.number)
        pic = page.get_pixmap(matrix=fitz.Matrix(zoom_x, zoom_y)) 
        dir_save = os.path.dirname(pdf_path) 
        pdf_name = os.path.basename(pdf_path).split('.pdf')[0]
        pic.save(f'{dir_save}/{pdf_name}-page-{page.number + 1}.png') 
        if page.number == 1: 
            break
    doc.close()
for root, dirs, files in os.walk(r"C:\Users\WangYang\Desktop\资料"):
    for file in files:
        if os.path.splitext(file)[1] == '.pdf':
            # print(file)
            pdf2img(
                os.path.join(root, file),
                zoom_x=3,
                zoom_y=3
            )

学无止境,谦卑而行.

文章标签：

Python

关键词：

PDF图片

PDF文件

Python图片

Python文件

Python PDF

。思索

游客akle7anmklvj6

1月前

机器学习/深度学习存储算法

解锁文件共享软件背后基于 Python 的二叉搜索树算法密码

文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构，通过有序存储和快速检索文件，极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序，支持高效插入、删除和查找操作，显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码，帮助理解其工作原理，并展望了该算法在分布式计算和机器学习领域的未来应用前景。

游客akle7anmklvj6

49 15 16

游客akle7anmklvj6

2天前

存储算法文件存储

探秘文件共享服务之哈希表助力 Python 算法实现

在数字化时代，文件共享服务不可或缺。哈希表（散列表）通过键值对存储数据，利用哈希函数将键映射到特定位置，极大提升文件上传、下载和搜索效率。例如，在大型文件共享平台中，文件名等信息作为键，物理地址作为值存入哈希表，用户检索时快速定位文件，减少遍历时间。此外，哈希表还用于文件一致性校验，确保传输文件未被篡改。以Python代码示例展示基于哈希表的文件索引实现，模拟文件共享服务的文件索引构建与检索功能。哈希表及其分布式变体如一致性哈希算法，保障文件均匀分布和负载均衡，持续优化文件共享服务性能。

游客akle7anmklvj6

14 6 6

蚝油菜花

1月前

人工智能编解码文字识别

OCRmyPDF：16.5K Star！快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具

OCRmyPDF 是一款开源命令行工具，专为将扫描的 PDF 文件转换为可搜索、可复制的文档。支持多语言、图像优化和多核处理。

蚝油菜花

239 17 17

OCRmyPDF：16.5K Star！快速将 PDF 文件转换为可搜索、可复制的文档的命令行工具

老乡别走

18天前

文字识别 Serverless 开发工具

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术，可自动提取学生信息并录入Excel，便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤，包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南，帮助用户高效处理PDF文件。链接： - 百度网盘：[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘：[链接](https://share.weiyun.com/a77jklXK)

老乡别走

54 5 5

老乡别走

1月前

文字识别 BI

【图片型PDF】批量识别扫描件PDF指定区域局部位置内容，将识别内容导出Excel表格或批量改名文件，基于阿里云OCR对图片型PDF识别改名案例实现

在医疗和政务等领域，图片型PDF文件（如病历、报告、公文扫描件）的处理需求广泛。通过OCR技术识别这些文件中的文字信息，提取关键内容并保存为表格，极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统，帮助用户快速处理图片型PDF文件，支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后，按步骤选择处理模式、进行区域采样、批量处理文件，几分钟内即可高效完成数百个文件的处理。

老乡别走

132 8 8

蚝油菜花

2月前

机器学习/深度学习人工智能文字识别

Zerox：AI驱动的万能OCR工具，精准识别复杂布局并输出Markdown格式，支持PDF、DOCX、图片等多种文件格式

Zerox 是一款开源的本地化高精度OCR工具，基于GPT-4o-mini模型，支持PDF、DOCX、图片等多种格式文件，能够零样本识别复杂布局文档，输出Markdown格式结果。

蚝油菜花

182 4 4

Zerox：AI驱动的万能OCR工具，精准识别复杂布局并输出Markdown格式，支持PDF、DOCX、图片等多种文件格式

蓝易云

2月前

监控网络安全开发者

Python中的Paramiko与FTP文件夹及文件检测技巧

通过使用 Paramiko 和 FTP 库，开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力，而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具，您可以更加高效地管理和监控远程服务器上的文件系统。

蓝易云

61 20 20

威哥爱编程

2月前

存储数据采集数据处理

如何在Python中高效地读写大型文件？

大家好，我是V哥。上一篇介绍了Python文件读写操作，今天聊聊如何高效处理大型文件。主要方法包括：逐行读取、分块读取、内存映射（mmap）、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存，提升效率。关注威哥爱编程，学习更多Python技巧。

威哥爱编程

105 8 8

蚝油菜花

3月前

人工智能文字识别数据挖掘

MarkItDown：微软开源的多格式转Markdown工具，支持将PDF、Word、图像和音频等文件转换为Markdown格式

MarkItDown 是微软开源的多功能文档转换工具，支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式，具备 OCR 文字识别、语音转文字和元数据提取等功能。

蚝油菜花

483 9 9

MarkItDown：微软开源的多格式转Markdown工具，支持将PDF、Word、图像和音频等文件转换为Markdown格式

哈你真皮

3月前

JavaScript

jquery图片和pdf文件预览插件

EZView.js是一款jquery图片和pdf文件预览插件。EZView.js可以为图片和pdf格式文件生成在线预览效果。支持的文件格式有pdf、jpg、 png、jpeg、gif。

哈你真皮

103 16 16

Python——批量将PDF文件转为图片

前言

内容

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Python——批量将PDF文件转为图片

前言

内容

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像