Python自动化处理word文件

简介: 自动化

批量生成word文档

安装openpyxl模块:
pip install openpyxl
安装python-docx模块:
pip install python-docx

openpyxl模块可以读写扩展名为.xlsx/.xlsm/.xltx/.xltm的Excel文件。
python-docx模块可以读写扩展名为.docx的Word文档,但不能处理扩展名为.doc的Word文档。
import re

from docx.enum.table import WD_CELL_VERTICAL_ALIGNMENT, WD_TABLE_ALIGNMENT
from openpyxl import load_workbook
from docx import Document

def info_update(doc, old_info, new_info):

"""
文档内容替换
:param doc: Word模板文档
:param old_info: 源文本
:param new_info: 新文本
:return:
"""
# 遍历Word文档中的所有段落
for para in doc.paragraphs:
    # 遍历每个段落中的run对象
    for run in para.runs:
        # 替换run对象的文本内容
        # run.text = run.text.replace(r'《'+old_info+'》', new_info)
        run.text = run.text.replace(old_info, new_info)
        run.text = re.sub(r'[《》]', '', run.text)

# 遍历Word文档中的所有表格
for table in doc.tables:
    # 遍历表格中的所有行
    for row in table.rows:
        # 遍历行中的所有单元格
        for cell in row.cells:
            # 替换单元格内容
            cell.text = cell.text.replace('《' + old_info + '》', new_info)

    # 设置表格中的内容居中显示
    # 计算表格的rows和cols的长度
    rows = len(table.rows)
    cols = len(table.columns)
    # 循环将每一行,每一列都设置为居中
    for r in range(rows):
        for c in range(cols):
            table.cell(r, c).vertical_alignment = WD_CELL_VERTICAL_ALIGNMENT.CENTER  # 垂直居中
            table.cell(r, c).paragraphs[0].paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER  # 水平居中

wb = load_workbook('学生成绩表.xlsx') # 打开工作簿
ws = wb.active # 激活工作簿中的工作表

遍历工作表的行,从第2行开始

for row in range(2, ws.max_row + 1):

doc = Document('成绩通知书.docx')  # 创建文档对象
# 遍历工作表的列
for col in range(1, ws.max_column + 1):
    # 读取当前列的第一行,即列标题,单元格的值转换成字符串
    old_info = str(ws.cell(row=1, column=col).value)
    # 读取当前列的数据,单元格的值需要转换成字符串
    new_info = str(ws.cell(row=row, column=col).value)
    # 进行内容替换
    info_update(doc, old_info, new_info)
    student_name = str(ws.cell(row=row, column=1).value)
    doc.save(f'scores\\成绩单--致{student_name}.docx')

将word文档转化为PDF文档

安装pywin32模块:
pip install pywin32
from pathlib import Path
from win32com.client import constants, gencache

创建Path对象

路径要使用绝对路径

src_folder = Path(r'E:\pythonProject\python办公自动化\第5章 自动化处理Word文档\scores')
output_folder = Path(r'E:\pythonProject\python办公自动化\第5章 自动化处理Word文档\PDF')

判断输出目录是否存在

if not output_folder.exists():

# 不存在则创建
output_folder.mkdir(parents=True)

file_list = list(src_folder.glob('*[.docx|.doc]')) # 获得要转换的Word文档的路径列表

word = gencache.EnsureDispatch('Word.Application') # 创建Word程序对象

word = win32com.client.Dispatch('Word.Application')

for word_path in file_list:

# 生成转换后的PDF文件的保存路径
pdf_path = output_folder / word_path.with_suffix('.pdf').name  # with_suffix()返回文件后缀已更改的新路径
# 判断pdf文件路径是否已存在
if pdf_path.exists():
    continue
else:
    # 路径需要是绝对路径,否则会报错
    doc = word.Documents.Open(str(word_path), ReadOnly=1)  # 打开Word文档
    # 设置导出格式为pdf
    doc.ExportAsFixedFormat(str(pdf_path), constants.wdExportFormatPDF)  # 将打开的Word文档另存为PDF文件,保存到给定的路径
    doc.Close()  # 关闭Word文档

word.Quit() # 关闭Word程序窗口

相关文章
|
5天前
|
存储 Python
一文让你搞懂 Python 的 pyc 文件
一文让你搞懂 Python 的 pyc 文件
28 15
|
5天前
|
机器学习/深度学习 人工智能 运维
自动化运维的魔法:如何利用Python脚本提升工作效率
【9月更文挑战第29天】在数字时代的浪潮中,IT运维人员面临着前所未有的挑战和机遇。本文将通过深入浅出的方式,介绍自动化运维的基本概念、核心价值以及使用Python脚本实现自动化任务的方法。我们将从实际案例出发,探讨如何利用Python简化日常的系统管理任务,提高运维效率,并展望自动化运维的未来趋势。无论你是初学者还是有经验的运维专家,这篇文章都将为你开启一扇通往高效工作方式的大门。
10 2
|
6天前
|
人工智能 IDE 开发工具
Python实行任意文件的加密—解密
Python实行任意文件的加密—解密
15 2
|
7天前
|
人工智能 IDE 开发工具
Python实行任意文件的加密—解密
Python实行任意文件的加密—解密
15 1
|
6天前
|
UED Python
Python requests库下载文件时展示进度条的实现方法
以上就是使用Python `requests`库下载文件时展示进度条的一种实现方法,它不仅简洁易懂,而且在实际应用中非常实用。
18 0
|
7天前
|
数据处理 Python
python遍历文件夹所有文件按什么排序
python遍历文件夹所有文件按什么排序
|
29天前
|
运维 Ubuntu Devops
自动化运维工具的魅力:Ansible入门
【9月更文挑战第5天】在快速变化的IT世界里,自动化运维不再是可选项,而是必需品。Ansible,一款简单却强大的自动化工具,正成为众多DevOps工程师的首选。本文将带你了解Ansible的基本概念、安装步骤以及如何编写简单的Playbook,从而开启你的自动化之旅。
67 36
|
5天前
|
机器学习/深度学习 运维 Cloud Native
构建高效运维体系:从自动化到智能化的演进之路
在当今数字化时代,运维作为信息技术的重要支柱,其效率与创新能力直接关系到企业信息系统的稳定性和业务连续性。本文将探讨如何通过技术手段,实现运维从传统手工操作向自动化、智能化的转变,进而构建一个高效、可靠的运维体系。我们将从自动化工具的应用开始,逐步深入到智能运维的实践,最终展望云原生架构下的运维未来趋势。
|
9天前
|
机器学习/深度学习 人工智能 运维
构建高效运维体系:从自动化到智能化的演进之路
在当今数字化时代,运维作为保障企业IT系统稳定运行的关键环节,正经历着前所未有的变革。本文将探讨如何通过实施自动化和引入智能化技术,构建一个更加高效、可靠的运维体系,以应对日益复杂的业务需求和技术挑战。
21 1
|
26天前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
下一篇
无影云桌面