Python办公自动化之批量生成文档

简介: Python办公自动化之批量生成文档

在日常工作中,类似合同一样的文档通常都会有固定的模板,如偶尔编辑一两份文档,则可以手动完成。假如同一个模板有一百份或更多文档需要生成呢?如果手工逐个文档的编辑保存,不仅容易出错,还是一项费力不讨好的工作;如果能够根据模板批量生成文档,则会大大提高工作效率,减少出错的几率。本文以一个简单的小例子,简述如何通过Python批量生成文档,仅供学习分享使用,如有不足之处,还请指正。

涉及知识点

  • xlrd模块,用于Excel文档的读取,其中xldate_as_tuple,主要用于Excel读取时的日期格式处理。
  • python-docx 模块,用于word文档的相关操作。

场景介绍

现有一份简化的合同模板,其中红色箭头所指的地方,均是需要替换的地方,如下所示:

同时有21名员工入职,需要签署这份合同,如下所示:

本文的功能就是根据模板文档,为21名员工,分别生成合同文档。

核心代码

1. 读取数据

读取Excel的数据,并返回数据列表,将此功能封装成单独的函数,如下所示:

def read_data(filename: str = None):
    """
    读取Excel文件内容
    :param fileName:
    :return:
    """
    datas = []
    work_book = xlrd.open_workbook(filename=filename)
    sheet = work_book.sheet_by_index(0)
    for i in range(1, sheet.nrows):
        # 日期格式转换
        birthday = xldate_as_tuple(sheet.cell_value(i, 6), 0)
        birthday2 = '%(year)d-%(month)d-%(day)d' % {'year': birthday[0], 'month': birthday[1], 'day': birthday[2]}
        bpdate = xldate_as_tuple(sheet.cell_value(i, 15), 0)
        bpdate2 = '%(year)d-%(month)d-%(day)d' % {'year': bpdate[0], 'month': bpdate[1], 'day': bpdate[2]}
        data = {
            'bpCompanyName': sheet.cell_value(i, 0),
            'bpAddress': sheet.cell_value(i, 1),
            'bpBoss': sheet.cell_value(i, 2),
            'bpManager': sheet.cell_value(i, 3),
            'bpWorker': sheet.cell_value(i, 4),
            'bpSex': sheet.cell_value(i, 5),
            'bpBirthday': birthday2,
            'bpHomeAddress': sheet.cell_value(i, 7),
            'bpId': sheet.cell_value(i, 8),
            'bpBeginYear': int(sheet.cell_value(i, 9)),  # 整数格式处理
            'bpBeginMonth': int(sheet.cell_value(i, 10)),  # 整数格式处理
            'bpBeginDay': int(sheet.cell_value(i, 11)),  # 整数格式处理
            'bpEndYear': int(sheet.cell_value(i, 12)),  # 整数格式处理
            'bpEndMonth': int(sheet.cell_value(i, 13)),  # 整数格式处理
            'bpEndDay': int(sheet.cell_value(i, 14)),  # 整数格式处理
            'bpDate': bpdate2,
            'bpSigner': sheet.cell_value(i, 16)
        }
        datas.append(data)
    return datas

2. 单个合同文档生成

Excel的每一行代表一名员工,生成一份合同文档【遍历每一个段落,以及每一个段落的文本,逐个替换文本中的变量内容,且保持原有的格式不变】,如下所示:

def write_docx(data, template):
    """
    生成文档
    :param data:
    :return:
    """
    doc = Document(docx=template)
    paragraphs = doc.paragraphs
    for paragraph in paragraphs:
        for run in paragraph.runs:
            for key in data.keys():
                run_text = run.text.replace(key, str(data[key]))
                run.text = run_text
    doc.save('合同/%s合同.docx' % data['bpWorker'])

3. 批量文档生成

遍历所有的员工信息,逐一生成文档,如下所示:

def batch_write_docx(datas, template):
    """
    批量操作
    :param datas:
    :return:
    """
    for data in datas:
        write_docx(data, template)

4. 综合运用

将以上方法依次调用,就可以生成全部文档,如下所示:

excel_file = '合同数据.xls'
template = '合同模板.docx'
datas = read_data(excel_file)
# print(datas)
batch_write_docx(datas, template)
print('done')

5. 示例完整代码

示例完整代码链接

示例截图

批量文档生成后,截图如下所示:

合同文档内文,如下所示:

以上就是批量生成文档的全部内容,可以看出,生成后的文档,格式与模板保持一致。

备注

书愤五首·其一

【作者】陆游 【朝代】宋

早岁那知世事艰,中原北望气如山。

楼船夜雪瓜洲渡,铁马秋风大散(sǎn)关。

塞上长城空自许,镜中衰鬓已先斑。

出师一表真名世,千载谁堪伯仲间。

相关文章
|
1月前
|
搜索推荐 Python
使用Python自动化生成物业通知单
本文介绍如何使用Python结合Pandas和python-docx库自动化生成物业通知单。通过读取Excel数据并填充至Word模板,实现高效准确的通知单批量制作。包括环境准备、代码解析及效果展示,适用于物业管理场景。
71 14
|
1月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
169 10
|
23天前
|
Python
自动化微信朋友圈:Python脚本实现自动发布动态
本文介绍如何使用Python脚本自动化发布微信朋友圈动态,节省手动输入的时间。主要依赖`pyautogui`、`time`、`pyperclip`等库,通过模拟鼠标和键盘操作实现自动发布。代码涵盖打开微信、定位朋友圈、准备输入框、模拟打字等功能。虽然该方法能提高效率,但需注意可能违反微信使用条款,存在风险。定期更新脚本以适应微信界面变化也很重要。
140 61
|
1月前
|
Python Windows
Python实现常用办公文件格式转换
本文介绍了如何使用Python及其相关库(如`pandas`、`openpyxl`、`python-docx`等)实现办公文件格式间的转换,包括XLS转XLSX、DOC转DOCX、PPT转PPTX、Word转PDF及PDF转Word,并提供了具体代码示例和注意事项。
195 89
|
5天前
|
机器学习/深度学习 运维 数据可视化
Python时间序列分析:使用TSFresh进行自动化特征提取
TSFresh 是一个专门用于时间序列数据特征自动提取的框架,支持分类、回归和异常检测等机器学习任务。它通过自动化特征工程流程,处理数百个统计特征(如均值、方差、自相关性等),并通过假设检验筛选显著特征,提升分析效率。TSFresh 支持单变量和多变量时间序列数据,能够与 scikit-learn 等库无缝集成,适用于大规模时间序列数据的特征提取与模型训练。其工作流程包括数据格式转换、特征提取和选择,并提供可视化工具帮助理解特征分布及与目标变量的关系。
43 16
Python时间序列分析:使用TSFresh进行自动化特征提取
|
26天前
|
存储 人工智能 人机交互
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
PC Agent 是上海交通大学与 GAIR 实验室联合推出的智能 AI 系统,能够模拟人类认知过程,自动化执行复杂的数字任务,如组织研究材料、起草报告等,展现了卓越的数据效率和实际应用潜力。
144 1
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
|
15天前
|
存储 安全 数据可视化
用Python实现简单的任务自动化
本文介绍如何使用Python实现任务自动化,提高效率和准确性。通过三个实用案例展示:1. 使用`smtplib`和`schedule`库自动发送邮件提醒;2. 利用`shutil`和`os`库自动备份文件;3. 借助`requests`库自动下载网页内容。每个案例包含详细代码和解释,并附带注意事项。掌握这些技能有助于个人和企业优化流程、节约成本。
48 3
|
1月前
|
JSON 数据可视化 测试技术
python+requests接口自动化框架的实现
通过以上步骤,我们构建了一个基本的Python+Requests接口自动化测试框架。这个框架具有良好的扩展性,可以根据实际需求进行功能扩展和优化。它不仅能提高测试效率,还能保证接口的稳定性和可靠性,为软件质量提供有力保障。
73 7
|
1月前
|
Android开发 开发者 Python
通过标签清理微信好友:Python自动化脚本解析
微信已成为日常生活中的重要社交工具,但随着使用时间增长,好友列表可能变得臃肿。本文介绍了一个基于 Python 的自动化脚本,利用 `uiautomator2` 库,通过模拟用户操作实现根据标签批量清理微信好友的功能。脚本包括环境准备、类定义、方法实现等部分,详细解析了如何通过标签筛选并删除好友,适合需要批量管理微信好友的用户。
70 7
|
1月前
|
安全 API 文件存储
Yagmail邮件发送库:如何用Python实现自动化邮件营销?
本文详细介绍了如何使用Yagmail库实现自动化邮件营销。Yagmail是一个简洁强大的Python库,能简化邮件发送流程,支持文本、HTML邮件及附件发送,适用于数字营销场景。文章涵盖了Yagmail的基本使用、高级功能、案例分析及最佳实践,帮助读者轻松上手。
53 4

热门文章

最新文章