Python批量将Word转换为PDF

简介: 对于将 Word 文件转换为 PDF 文件,是我们经常需要的工作。单个文件转的话,Word 本身就支持手动转换,但若有大批量的文件需要转换,这种方式还是有不小的工作量。所以,为了更加便利和高效,我使用 Python 编写了一个批量转换工具,在这里分享给大家。

0f548d5f16478300dac5a795e3f181d7_20230426-3_time=1686816000&token=b74dbbdd0ccda613b77891558015f1cb&role=free.gif

大家好,我是水滴~

对于将 Word 文件转换为 PDF 文件,是我们经常需要的工作。单个文件转的话,Word 本身就支持手动转换,但若有大批量的文件需要转换,这种方式还是有不小的工作量。

所以,为了更加便利和高效,我使用 Python 编写了一个批量转换工具,在这里分享给大家。

上面的 GIF 图片就是转换的过程。在使用前,需要安装 pywin32docx2pdf 两个库,下面是详细教程。

安装 pywin32

该库为 Python for Win32(pywin32)扩展的自述文件,它提供了从 Python 访问 Windows API 的权限。

pip install pywin32

安装 docx2pdf

该库可以将 Word 文件转换为 PDF 文件。

pip install docx2pdf

批量转换代码

获取指定目录中所有 docx 文件:

# 获取所有 docx 文件
def get_docx_files(input_path):
    docx_files = list()
    for filename in os.listdir(input_path):
        if filename.endswith(".docx"):
            docx_files.append(filename)
    return docx_files

docx 文件转换为 pdf 文件:

# 将该目录下所有 docx 文件转换为 pdf
def docx2pdf(input_path):
    docx_files = get_docx_files(input_path)
    for docx_file in docx_files:
        print("开始转换 -> " + docx_file)
        convert(input_path + docx_file)

获取源码,请在下方「水滴技术」公众号回复:20230426

相关文章
|
2天前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
41 8
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
2月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
2月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
443 1
|
2月前
|
人工智能 开发者 Python
python读取word文档 | AI应用开发
在RAG系统中,构建知识库时需读取多种外部文档,其中Word文档较为常见。本文介绍如何使用`python-docx`库读取Word文档(.docx格式)中的标题、段落、表格和图片等内容。首先通过`pip install python-docx`安装库,然后利用提供的接口提取所需信息。尽管该库功能强大,但在识别标题样式时需自定义逻辑,并且仅提供图片的URI而非直接加载。示例代码展示了读取文本、识别标题、读取表格及获取图片URI的方法。【10月更文挑战第2天】
97 2
|
2月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
49 3
|
2月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件
37 1
|
2月前
|
存储 安全 网络安全
Python编程--使用PyPDF解析PDF文件中的元数据
Python编程--使用PyPDF解析PDF文件中的元数据
66 1
|
2月前
|
IDE 开发工具 Python
Python自动化操作word--批量替换word文档中的文字
Python自动化操作word--批量替换word文档中的文字
171 0
|
2月前
|
IDE 开发工具 数据安全/隐私保护
Python编程实现批量md5加密pdf文件
Python编程实现批量md5加密pdf文件
42 0
|
3月前
|
数据安全/隐私保护 Python
Python办公自动化:给pdf加水印
Python办公自动化:给pdf加水印
46 0