记录一次py中如何将excel中的数据导出到word中, 关键字导出

简介: 记录一次py中如何将excel中的数据导出到word中, 关键字导出

完整代码如下:

import openpyxl
from docx import Document
import datetime
# 打开excel文件并读取数据
workbook = openpyxl.load_workbook('list.xlsx')
sheet = workbook.active
data = []
for row in sheet.iter_rows(min_row=2, values_only=True):
    row = [str(cell) if cell is not None else "" for cell in row]
    data.append(row)
for j in range(len(data)):
    # 打开word文件并替换文本
    document = Document('model.docx')
    for paragraph in document.paragraphs:
        # print(paragraph.text)
        if "致,{{name}}" in paragraph.text and data[j][0]:
            paragraph.text = paragraph.text.replace("{{name}}", data[j][0])
        if "{{date1}}" in paragraph.text and data[j][6]:
            paragraph.text = paragraph.text.replace("{{date1}}", data[j][6])
        if "{{hi}}" in paragraph.text and data[j][10]:
            paragraph.text = paragraph.text.replace("{{hi}}", data[j][10])
        if "{{date2}}" in paragraph.text and data[j][6] and not "{{date1}}" in paragraph.text:
            paragraph.text = paragraph.text.replace("{{date2}}", data[j][6])
        if "{{date2}}" in paragraph.text and data[j][7] and "{{date1}}" in paragraph.text:
            paragraph.text = paragraph.text.replace("{{date2}}", data[j][7])
        if "{{bj}}" in paragraph.text and data[j][8]:
            paragraph.text = paragraph.text.replace("{{bj}}", data[j][8])
        if "{{wyj}}" in paragraph.text and data[j][9]:
            paragraph.text = paragraph.text.replace("{{wyj}}", data[j][9])
    now = datetime.datetime.now().strftime("%Y-%m-%d_%H:%M:%S")
    document.save(f'output_{data[j][0]}_{now}.docx')
# 关闭 Excel 文件
workbook.close()

分析:


这段代码的主要功能是从excel文件中读取数据,然后以此数据为基础替换掉word文档中的相应占位符,并将替换后的word文档保存为新文件。

具体流程如下:

  1. 引入 openpyxldocx 两个库,分别用于操作excel和word文件。
import openpyxl
from docx import Document
  1. 使用 openpyxl 库打开excel文件list.xlsx,并将数据读出保存到变量 data 中。在读取数据时,如果单元格的值为 None,则将其转换为空字符串 “”。
workbook = openpyxl.load_workbook('list.xlsx')  # 打开excel文件
sheet = workbook.active  # 获取活动工作表
data = []
for row in sheet.iter_rows(min_row=2, values_only=True):
    row = [str(cell) if cell is not None else "" for cell in row]  # 转换None为""
    data.append(row)
workbook.close()  # 关闭Excel文件

在这里我们使用了 min_row=2 来跳过第一行,因为第一行通常是表头,不是我们需要的数据。

  1. 使用 docx 库打开Word文档model.docx,并将文本进行替换,最后将替换后的word文档输出为新文件。
document = Document('model.docx')  # 打开word模板
for paragraph in document.paragraphs:
    if "致,{{name}}" in paragraph.text:
        for j in range(len(data)):
            for paragraph in document.paragraphs:
                if "{{name}}" in paragraph.text and data[j][0]:
                    paragraph.text = paragraph.text.replace("{{name}}", data[j][0])
                if "{{date1}}" in paragraph.text and data[j][6]:
                    paragraph.text = paragraph.text.replace("{{date1}}", data[j][6])
                if "{{hi}}" in paragraph.text and data[j][10]:
                    paragraph.text = paragraph.text.replace("{{hi}}", data[j][10])
                if "{{date2}}" in paragraph.text and data[j][6] and not "{{date1}}" in paragraph.text:
                    paragraph.text = paragraph.text.replace("{{date2}}", data[j][6])
                if "{{date2}}" in paragraph.text and data[j][7] and "{{date1}}" in paragraph.text:
                    paragraph.text = paragraph.text.replace("{{date2}}", data[j][7])
                if "{{bj}}" in paragraph.text and data[j][8]:
                    paragraph.text = paragraph.text.replace("{{bj}}", data[j][8])
                if "{{wyj}}" in paragraph.text and data[j][9]:
                    paragraph.text = paragraph.text.replace("{{wyj}}", data[j][9])
            print(data,j)
            document.save(f'output_{data[j][0]}.docx')

在这个过程中,我们使用了双重循环。外层的 for 循环遍历Word文档中的每一段落,找到包含 致,{{name}} 文本的段落。内层的 for 循环用来遍历数据,每次将数据中的占位符 {{name}} 等替换为相应的数据,最后通过 document.save() 方法将替换好数据的Word文档保存为新文件,文件名为 output_{name}.docx,其中 name 是该行数据中的第一列。

  1. 最后,关闭Excel文件。

需要注意的是,在内层循环中,要在替换完相应的占位符后再调用 document.save() 方法保存Word文档,否则会导致代码多次保存同一个文件,从而覆盖之前保存的内容。

相关文章
|
2月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
305 10
|
3月前
|
Java API Apache
Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
【10月更文挑战第29天】Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
207 5
|
7天前
|
文字识别 BI
【图片型PDF】批量识别扫描件PDF指定区域局部位置内容,将识别内容导出Excel表格或批量改名文件,基于阿里云OCR对图片型PDF识别改名案例实现
在医疗和政务等领域,图片型PDF文件(如病历、报告、公文扫描件)的处理需求广泛。通过OCR技术识别这些文件中的文字信息,提取关键内容并保存为表格,极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统,帮助用户快速处理图片型PDF文件,支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后,按步骤选择处理模式、进行区域采样、批量处理文件,几分钟内即可高效完成数百个文件的处理。
49 8
|
2月前
|
人工智能 自然语言处理 JavaScript
Univer:开源全栈 AI 办公工具,支持 Word、Excel、PPT 等文档处理和多人实时协作
Univer 是一款开源的 AI 办公工具,支持 Word、Excel 等文档处理的全栈解决方案。它具有强大的功能、高度的可扩展性和跨平台兼容性,适用于个人和企业用户,能够显著提高工作效率。
182 8
Univer:开源全栈 AI 办公工具,支持 Word、Excel、PPT 等文档处理和多人实时协作
|
2月前
|
存储 Java easyexcel
招行面试:100万级别数据的Excel,如何秒级导入到数据库?
本文由40岁老架构师尼恩撰写,分享了应对招商银行Java后端面试绝命12题的经验。文章详细介绍了如何通过系统化准备,在面试中展示强大的技术实力。针对百万级数据的Excel导入难题,尼恩推荐使用阿里巴巴开源的EasyExcel框架,并结合高性能分片读取、Disruptor队列缓冲和高并发批量写入的架构方案,实现高效的数据处理。此外,文章还提供了完整的代码示例和配置说明,帮助读者快速掌握相关技能。建议读者参考《尼恩Java面试宝典PDF》进行系统化刷题,提升面试竞争力。关注公众号【技术自由圈】可获取更多技术资源和指导。
|
3月前
|
前端开发
实现Excel文件和其他文件导出为压缩包,并导入
实现Excel文件和其他文件导出为压缩包,并导入
50 1
|
3月前
|
数据格式 UED
记录一次NPOI库导出Excel遇到的小问题解决方案
【11月更文挑战第16天】本文记录了使用 NPOI 库导出 Excel 过程中遇到的三个主要问题及其解决方案:单元格数据格式错误、日期格式不正确以及合并单元格边框缺失。通过自定义单元格样式、设置数据格式和手动添加边框,有效解决了这些问题,提升了导出文件的质量和用户体验。
328 3
|
4月前
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
268 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
|
3月前
|
Java API Apache
|
3月前
|
存储 Java API
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
172 4

热门文章

最新文章