Python技巧篇:如何巧妙运用Python处理Word文档

简介: Python技巧篇:如何巧妙运用Python处理Word文档

前言
大家好,我是辣条
之前有给大家分享了一篇:《Python实例篇:自动操作Excel文件(既简单又特别实用)》

根据很多粉丝反馈是有用处的,于是乎应广大群众号召,今天给大家再来一波Python操作Word文档,我可是长期更新分享的,订阅一下我的博客不会错的

大家平时在工作与学习中都会操作到Word文件格式,特别是很多数据的时候,靠人力去识别操作非常容易出错。今天就带大家用python来处理Word文件。

目录
前言
工具
生成Word案例
读取操作word文档
总结:
工具
python3.7
Pycharm
Excel
python-docx

生成Word案例
​ 创建一个demo.doc文档,代码如下:

from docx import Document
from docx.shared import Cm,Pt
from docx.document import Document as Doc

构建doc对象

document = Document()

操作文档标题

document.add_heading('这是python写的!',0)

操作段落文本

p = document.add_paragraph('我喜欢python,因为python可以做许多事情...')

段落添加内容

run = p.add_run('大家也可以来学习!')

对run内容加粗

run.bold = True

设置run字体

run.font.size = Pt(18)

标题级别设置

document.add_heading('我是一级标题',level=1)

操作图片(图片所在路径)

document.add_picture('刘亦菲.png', width=Cm(5.2))

添加有序列表

document.add_paragraph(

'我是有序列表1', style='List Number'

)
document.add_paragraph(

'我是有序列表1', style='List Number'

)

添加无序列表

document.add_paragraph(

'我是无序列表1', style='List Bullet'

)
document.add_paragraph(

'我是无序列表2', style='List Bullet'

)

设置表格内容

records = (

('孙悟空', '男', '1111-1-1'),
('白骨精', '女', '2222-2-2')

)

添加表格,rows设置行 cols设置列

table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells

设置列名

hdr_cells[0].text = '姓名'
hdr_cells[1].text = '性别'
hdr_cells[2].text = '出生日期'

操作写入行

for name, sex, birthday in records:

row_cells = table.add_row().cells
row_cells[0].text = name
row_cells[1].text = sex
row_cells[2].text = birthday

保存doc文档

document.save('demo.docx')

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
​ 效果如下:

更多属性设置可以参考官方文档:https://python-docx.readthedocs.io/en/latest/index.html

读取操作word文档
​ 现有文档如下:

​ 读取代码:

from docx import Document
from docx.document import Document as Doc

获取文档路径,循环读取内容

doc = Document('离职证明.docx') # type: Doc
for no, p in enumerate(doc.paragraphs):

print(no, p.text)

1
2
3
4
5
6
7
​ 效果如下:

​ 如果需要批量操作,则可以使用字典形式组织数据类型,比如name,start_time,end_time,job等,再使用循环写入文件即可批量生成该类文档。

总结:
​ 当需要批量操作文档时候,可以使用python-docx库来操作,可以较大提升工作效率。如果需要更多属性操作,请参考上面官方文档。

目录
相关文章
|
3月前
|
数据采集 Python
Python实用记录(七):通过retinaface对CASIA-WebFace人脸数据集进行清洗,并把错误图路径放入txt文档
使用RetinaFace模型对CASIA-WebFace人脸数据集进行清洗,并将无法检测到人脸的图片路径记录到txt文档中。
57 1
|
3月前
|
Python
Python实用记录(六):如何打开txt文档并删除指定绝对路径下图片
这篇文章介绍了如何使用Python打开txt文档,删除文档中指定路径的图片,并提供了一段示例代码来展示这一过程。
39 1
|
3月前
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
186 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
|
3月前
|
计算机视觉 Python
Python实用记录(九):将不同的图绘制在一起、将不同txt文档中的数据绘制多条折线图
这篇文章介绍了如何使用Python的OpenCV库将多张图片合并为一张图片显示,以及如何使用matplotlib库从不同txt文档中读取数据并绘制多条折线图。
57 3
Python实用记录(九):将不同的图绘制在一起、将不同txt文档中的数据绘制多条折线图
|
3月前
|
人工智能 开发者 Python
python读取word文档 | AI应用开发
在RAG系统中,构建知识库时需读取多种外部文档,其中Word文档较为常见。本文介绍如何使用`python-docx`库读取Word文档(.docx格式)中的标题、段落、表格和图片等内容。首先通过`pip install python-docx`安装库,然后利用提供的接口提取所需信息。尽管该库功能强大,但在识别标题样式时需自定义逻辑,并且仅提供图片的URI而非直接加载。示例代码展示了读取文本、识别标题、读取表格及获取图片URI的方法。【10月更文挑战第2天】
118 2
|
4月前
|
存储 数据采集 关系型数据库
Python之文档数据存储
Python之文档数据存储
43 2
|
5月前
|
JSON 测试技术 API
Python开发解析Swagger文档小工具
文章介绍了如何使用Python开发一个解析Swagger文档的小工具,该工具可以生成符合httprunner测试框架的json/yaml测试用例,同时还能输出Excel文件,以方便测试人员根据不同需求使用。文章提供了详细的开发步骤、环境配置和使用示例,并鼓励读者为该开源项目贡献代码和建议。
135 1
Python开发解析Swagger文档小工具
|
3月前
|
IDE 开发工具 Python
Python自动化操作word--批量替换word文档中的文字
Python自动化操作word--批量替换word文档中的文字
241 0
|
5月前
|
XML 存储 数据格式
使用Python的zipfile模块巧解Word批量生成问题
通过以上步骤,我们得到了填充了特定数据的 Word 文档。这个过程可以通过循环对多个数据集重复执行,从而实现批量生成多个 Word 文档的目标。
47 5
|
5月前
|
Python
Python——将PPT和Word转为PDF文件
Python——将PPT和Word转为PDF文件
95 1
下一篇
开通oss服务