python自动化办公——python操作Excel、Word、PDF集合大全(九)

简介: python自动化办公——python操作Excel、Word、PDF集合大全(九)

② 解密pdf并保存为未加密的pdf

from PyPDF2 import PdfFileReader, PdfFileWriter
pdf_reader = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\时间序列.pdf")
# 解密pdf
pdf_reader.decrypt("a123456")
pdf_writer = PdfFileWriter()
for page in range(pdf_reader.getNumPages()):
    pdf_writer.addPage(pdf_reader.getPage(page))
with open("G:\\6Tipdm\\7python办公自动化\\concat_pdf\\未加密的时间序列.pdf", "wb") as out:
        pdf_writer.write(out)


结果如下:

image.png


章节三:python使用python-docx操作word

1、python-docx库介绍

该模块儿可以创建、修改Word(.docx)文件;

此模块儿不属于python标准库,需要单独安装;

python-docx使用官网: python-docx官网

我们在安装此模块儿使用的是pip install python-docx,但是在导入的时候是import docx;

2、Python读取Word文档内容

注意:每进行一个操作,必须保存一下,否则等于白做;

1)word文档结构介绍


image.png

2)python-docx提取文字和文字块儿

① python-docx提取文字

有一个这样的docx文件,我们想要提取其中的文字,应该怎么做?

image.png

代码如下:


from docx import Document
doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
print(doc.paragraphs)
for paragraph in doc.paragraphs:
    print(paragraph.text)


结果如下:

image.png


② python-docx提取文字块儿

from docx import Document
doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
print(doc.paragraphs)
paragraph = doc.paragraphs[0]
runs = paragraph.runs
print(runs)
for run in paragraph.runs:
    print(run.text)
------------------------------
paragraph = doc.paragraphs[1]
runs = paragraph.runs
print(runs)
for run in paragraph.runs:
    print(run.text)


结果如下:

image.png


3)利用Python向Word文档写入内容

① 添加段落

from docx import Document
doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
# print(doc.add_heading("一级标题", level=1))   添加一级标题的时候出错,还没有解决!
paragraph1 = doc.add_paragraph("这是一个段落")
paragraph2 = doc.add_paragraph("这是第二个段落")
doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx") 
"""
添加段落的时候,赋值给一个变量,方便我们后面进行格式调整;
"""


结果如下:

image.png

相关文章
|
13天前
|
Java API Apache
Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
【10月更文挑战第29天】Java编程如何读取Word文档里的Excel表格,并在保存文本内容时保留表格的样式?
66 5
|
2月前
|
Python
Python办公自动化:删除任意页数pdf页面
Python办公自动化:删除任意页数pdf页面
77 1
Python办公自动化:删除任意页数pdf页面
|
2月前
|
Python
Python办公自动化:xlwings对Excel进行分类汇总
Python办公自动化:xlwings对Excel进行分类汇总
76 1
|
1月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
|
1月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件
|
1月前
|
存储 安全 网络安全
Python编程--使用PyPDF解析PDF文件中的元数据
Python编程--使用PyPDF解析PDF文件中的元数据
|
1月前
|
索引 Python
Excel学习笔记(一):python读写excel,并完成计算平均成绩、成绩等级划分、每个同学分数大于70的次数、找最优成绩
这篇文章是关于如何使用Python读取Excel文件中的学生成绩数据,并进行计算平均成绩、成绩等级划分、统计分数大于70的次数以及找出最优成绩等操作的教程。
58 0
|
1月前
|
IDE 开发工具 Python
Python自动化操作word--批量替换word文档中的文字
Python自动化操作word--批量替换word文档中的文字
|
1月前
|
IDE 开发工具 数据安全/隐私保护
Python编程实现批量md5加密pdf文件
Python编程实现批量md5加密pdf文件
|
2月前
|
数据安全/隐私保护 Python
Python办公自动化:给pdf加水印
Python办公自动化:给pdf加水印
32 0