使用Python自动化Microsoft Excel和Word

简介: 使用Python自动化Microsoft Excel和Word

毫无疑问,微软的Excel和Word是公司和非公司领域使用最广泛的两款软件。它们实际上是“工作”的同义词。通常情况下,每一周我们都会将两者结合起来,并以某种方式发挥它们的优点。虽然一般的日常用途不会要求自动化,但有时自动化可能是必需的。也就是说,当您有大量的图表、图形、表格和报告要生成时,如果您选择手动方式,它可能会成为一项极其繁琐的工作。其实没必要这样。实际上,有一种方法可以在Python中创建一个管道,您可以将两者无缝集成,在Excel中生成电子表格,然后将结果传输到Word中,几乎即时生成报告。

Openpyxl

Openpyxl它可以说是Python中最通用的包之一,它可以非常容易使用Excel接口。有了它,你可以读和写所有当前和最早的excel格式,即xlsx和xls。Openpyxl允许您填充行和列、执行公式、创建2D和3D图表、标记轴和标题,以及其他许多非常有用的功能。然而,最重要的是,这个包允许您在Excel中遍历无穷多的行和列,从而避免了之前必须做的所有烦人的数字处理和绘图。

Python-docx

然后是Python-docx,这个包之于Word就像Openpyxl之于Excel。如果您还没有学习他们的文档,那么您可能应该看一看。毫不夸张地说,Python-docx是我开始使用Python以来使用过的最简单、最不言自明的工具包之一。它允许您通过插入文本、填充表格和在报表中自动渲染图像来自动生成文档。

言归正传,让我们创建我们自己的自动化流水线。继续使用Anaconda(或者你选择的任何其他IDE)并安装以下软件包:

pip install openpyxl

pip install python-docx

Microsoft Excel自动化

首先,我们将加载一个已经创建好的Excel工作簿(如下所示):

workbook=xl.load_workbook('Book1.xlsx')
sheet_1=workbook['Sheet1']

640.png

随后,我们将遍历电子表格中的所有行,通过电流乘以电压来计算和插入功率值:

forrowinrange(2, sheet_1.max_row+1):
current=sheet_1.cell(row, 2)
voltage=sheet_1.cell(row, 3)
power=float(current.value) *float(voltage.value)
power_cell=sheet_1.cell(row, 1)
power_cell.value=power

一旦完成,我们将使用计算的功率值生成折线图,将插入指定的单元格,如下图所示:

values=Reference(sheet_1, min_row=2, max_row=sheet_1.max_row, min_col=1, max_col=1)
chart=LineChart()
chart.y_axis.title='Power'chart.x_axis.title='Index'chart.add_data(values)
sheet_1.add_chart(chart, 'e2')
workbook.save('Book1.xlsx')

640.png

现在我们已经生成了图表,我们需要将其提取为图像,以便在Word报告中使用它。首先,我们将确定Excel文件的确切位置,以及输出的图表图像应该保存的位置:

input_file="C:/Users/.../Book1.xlsx"output_image="C:/Users/.../chart.png"

然后使用以下方法访问电子表格:

operation=win32com.client.Dispatch("Excel.Application")
operation.Visible=0operation.DisplayAlerts=0workbook_2=operation.Workbooks.Open(input_file)
sheet_2=operation.Sheets(1)

你可以迭代电子表格中的所有图表对象(如果有一个以上),并将它们保存在指定的位置如下:

forx, chartinenumerate(sheet_2.Shapes):
chart.Copy()
image=ImageGrab.grabclipboard()
image.save(output_image, 'png')
passworkbook_2.Close(True)
operation.Quit()

Microsoft Word自动化

现在我们已经生成了图表图像,我们必须创建一个模板文档,它基本上是一个普通的Microsoft Word文档(.docx),它完全按照我们希望的报告外观来制定,包括字体、字体大小、格式和页面结构。然后,我们需要做的就是为我们的自动内容创建占位符,即表值和图像,并使用变量名声明它们,如下所示。

640.png

任何自动的内容都可以在双花括号{{variable_name}}中声明,包括文本和图像。对于表,你需要创建一个包含所有列的模板行表,然后你需要在上面加上一行,下面加上一行,符号如下:

第一行:

{%trforiteminvariable_name%}

最后一行:

{%trendfor%}

在上图中,变量名是:

  1. table_contents用于存储表格数据的Python字典
  2. 字典键的索引(第一列)
  3. 字典值的功率、电流和电压(第二、第三和第四列)

然后我们将模板文档导入Python,并创建一个字典来存储表中的值:

template=DocxTemplate('template.docx')
table_contents= []foriinrange(2, sheet_1.max_row+1):
table_contents.append({
'Index': i-1,
'Power': sheet_1.cell(i, 1).value,
'Current': sheet_1.cell(i, 2).value,
'Voltage': sheet_1.cell(i, 3).value      })

接下来,我们将导入之前由Excel生成的图表图像,并创建另一个字典来实例化模板文档中声明的所有占位符变量:

image=InlineImage(template,'chart.png',Cm(10))context= {
'title': 'Automated Report',
'day': datetime.datetime.now().strftime('%d'),
'month': datetime.datetime.now().strftime('%b'),
'year': datetime.datetime.now().strftime('%Y'),
'table_contents': table_contents,
'image': image  }

最后,我们将用我们的值表和图表图像渲染报告:

template.render(context)
template.save('Automated_report.docx')

结果

好了,这就是一个自动生成的Microsoft Word报告,包含数字和在Microsoft Excel中创建的图表。这样你就有了一个完全自动化的管道,可以用来创建尽可能多的表格、图表和文档。

640.png

最后,完整的代码在这里:https://github.com/mkhorasani/excel_word_automation 有兴趣的可以下载修改和执行

目录
相关文章
|
1天前
aspose实现word,excel等文件预览
aspose实现word,excel等文件预览
|
1天前
|
JSON 监控 调度
局域网管理软件的自动化任务调度:Python 中的 APScheduler 库的应用
使用 Python 的 APScheduler 库可简化局域网管理中的自动化任务调度。APScheduler 是一个轻量级定时任务调度库,支持多种触发方式如间隔、时间、日期和 Cron 表达式。示例代码展示了如何创建每 10 秒执行一次的定时任务。在局域网管理场景中,可以利用 APScheduler 定期监控设备状态,当设备离线时自动提交数据到网站,提升管理效率。
12 0
|
6天前
|
存储 安全 数据库
自动化密码填充:使用Python提高日常工作效率
自动化密码填充:使用Python提高日常工作效率
11 0
|
6天前
|
SQL 数据库 数据库管理
python自动生成SQL语句自动化
python自动生成SQL语句自动化
23 1
|
6天前
|
持续交付 Python
使用Python实现自动化Web内容巡检
使用Python实现自动化Web内容巡检
17 1
|
9天前
|
监控 测试技术 持续交付
Python自动化测试代理程序可用性
总之,通过编写测试用例、自动化测试和设置监控系统,您可以确保Python自动化测试代理程序的可用性,并及时发现和解决问题。这有助于提供更可靠和高性能的代理服务。
14 4
|
12天前
|
机器学习/深度学习 数据采集 算法
【Python机器学习专栏】自动化特征选择与优化的实践
【4月更文挑战第30天】特征选择在机器学习中至关重要,能降低模型复杂度,提高泛化能力和避免过拟合。本文介绍了自动化特征选择的三种方法:过滤法(如SelectKBest)、包装法(如RFE)和嵌入法(如随机森林)。通过结合这些方法,可实现特征优化,包括数据预处理、初步筛选、模型训练与评估、特征优化和结果验证。自动化特征选择能提升模型性能,适应不同数据集和任务需求,为机器学习项目提供坚实基础。
|
13天前
|
存储 Python Windows
轻松学会openpyxl库,Python处理Excel有如神助
轻松学会openpyxl库,Python处理Excel有如神助
|
1月前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。
|
2月前
|
数据采集 机器学习/深度学习 算法框架/工具
利用Python实现基于图像识别的自动化数据采集系统
本文介绍了如何利用Python编程语言结合图像识别技术,构建一个自动化的数据采集系统。通过分析图像内容,实现对特定信息的提取和识别,并将其转化为结构化数据,从而实现高效、准确地采集需要的信息。本文将详细讨论系统的设计思路、技术实现以及应用场景。

热门文章

最新文章