文档备案控制台

开发者社区开发与运维文章正文

python获取pdf和word文档页数

2023-11-09 1283

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： python获取pdf和word文档页数

python获取word文档和pdf文档页数的方法

1、获取pdf页码数

这里要使用到 pdfplumber 这个库，首先导入

没有安装的同学还需要先安装

pip install pdfplumber

import pdfplumber
from pdfminer.pdfparser import PDFSyntaxError

官方教程

https://codechina.csdn.net/mirrors/jsvine/pdfplumber?utm_source=csdn_github_accelerator

代码如下：

#获取pdf文档页数
def get_pdf_page(pdf_path):
    try:
        f = pdfplumber.open(pdf_path)
        page = len(f.pages)
    except PDFSyntaxError:
        page = 0
    return page

2、获取word文档页码数

这里我们需要用到pythoncom和win32com这两个库，先导入

import pythoncom
import win32com

代码如下

#获取word文档页数
def get_word_page(word_path): 
    pythoncom.CoInitialize()
    # 调用word程序，不在前台显示
    w = win32com.client.Dispatch("Word.Application")
    w.Visible = 0
    w.DisplayAlerts = 0
    # 打开一个word文档
    doc = w.Documents.Open(word_path)
    # 获取总页数
    w.ActiveDocument.Repaginate()
    pages = w.ActiveDocument.ComputeStatistics(2)
    print(pages)
    # 保存并关闭
    doc.SaveAs('test.docx')
    doc.Close()
    return pages

文章标签：

Python

关键词：

Python Word

Python word文档

Python文档

Python PDF

PDF文档

JYeontu

目录

相关文章

站大爷

|

9月前

|

XML 数据格式 Python

从手动编辑到代码生成：Python 助你高效创建 Word 文档

本文介绍如何用Python实现Word文档自动化生成，结合python-docx、openpyxl和matplotlib库，高效完成报告撰写、数据插入与图表生成，大幅提升办公效率，降低格式错误，实现数据驱动的文档管理。

站大爷

1179 2 3

云流雨洄

|

11月前

|

安全 JavaScript 开发者

Python 自动化办公神器｜一键转换所有文档为 PDF

本文介绍一个自动化批量将 Word、Excel、PPT、TXT、HTML 及图片转换为 PDF 的 Python 脚本。支持多格式识别、错误处理与日志记录，适用于文档归档、报告整理等场景，大幅提升办公效率。仅限 Windows 平台，需安装 Office 及相关依赖。

云流雨洄

553 0 0

ayuday

|

10月前

|

小程序

公众号如何添加附传Word、Excel、Pdf、PPT文档

公众号里添加一些文档给公众号粉丝下载，比如课件PPT、申请表Word文档、岗位需求Excel表、大赛入围/获奖名单等。公众号本身是不支持直接上传文件的，但我们可以通过附件小程序“间接”上传文件。

ayuday

1511 0 0

盹猫

|

12月前

|

XML Linux 区块链

Python提取Word表格数据教程(含.doc/.docx)

本文介绍了使用LibreOffice和python-docx库处理DOC文档表格的方法。首先需安装LibreOffice进行DOC到DOCX的格式转换，然后通过python-docx读取和修改表格数据。文中提供了详细的代码示例，包括格式转换函数、表格读取函数以及修改保存功能。该方法适用于Windows和Linux系统，解决了老旧DOC格式文档的处理难题，为需要处理历史文档的用户提供了实用解决方案。

盹猫

1357 1 1

34789737

|

存储人工智能文字识别

三款安卓手机word编辑器下载，Microsoft Word,wps office,Word手机版，手机word编辑查看阅读器，PDF转换器apk下载

WPS Office是一款功能强大的办公软件，支持文档编辑、表格处理和演示文稿制作，兼容多种格式并提供丰富的云服务。它具备低内存占用、快速运行的特点，支持跨设备同步与多人协作，内置海量模板及AI辅助功能，如智能写作和PPT自动生成。此外，还可扫描文件、编辑PDF并转换为其他格式，极大提升办公效率，适合手机用户便捷操作。

34789737

1264 1 1

站大爷

|

Python

Python 办公实战：用 python-docx 自动生成 Word 文档

本文详解如何使用 python-docx 库实现 Word 文档自动化生成，涵盖环境搭建、文档创建、格式设置、表格与图片处理、模板填充、批量生成及性能优化等实战技巧，助你高效完成办公场景中的文档自动化任务。

站大爷

2757 1 1

站大爷

|

11月前

|

监控 Linux 数据安全/隐私保护

Python实现Word转PDF全攻略：从入门到实战

在数字化办公中，Python实现Word转PDF自动化，可大幅提升处理效率，解决格式兼容问题。本文详解五种主流方案，包括跨平台的docx2pdf、Windows原生的pywin32、服务器部署首选的LibreOffice命令行、企业级的Aspose.Words，以及轻量级的python-docx+pdfkit组合。每种方案均提供核心代码与适用场景，并涵盖中文字体处理、表格优化、批量进度监控等实用技巧，助力高效办公自动化。

站大爷

2154 0 0

cxhuan

|

数据处理 Python

第105天： Python 操作 Word

第105天： Python 操作 Word

cxhuan

445 0 0

第105天： Python 操作 Word

九月天空

|

10月前

|

数据采集机器学习/深度学习人工智能

Python：现代编程的首选语言

Python：现代编程的首选语言

九月天空

1610 102 103

九月天空

|

10月前

|

数据采集机器学习/深度学习算法框架/工具

Python：现代编程的瑞士军刀

Python：现代编程的瑞士军刀

九月天空

502 104 104

热门文章

最新文章

撒花！《神经网络与深度学习》中文教程正式开源！全书 pdf、ppt 和代码一同放出

Java操作wkhtmltopdf实现Html转PDF

【2016阿里安全峰会】电子取证：静静聆听那些真相【附PDF下载】

AI工程师必读的10本ML读物（附PDF下载）

PDF文档打印问题

《VERICUT 9.X电脑配置要求与安装说明(官方)》—— PDF文档

java 使用itextpdf分割pdf文件，pdf分页

Vue 结合html2canvas和jsPDF实现html页面转pdf

SharePoint 2013 启用查看PDF功能

csdn 《程序员》杂志2011年第4期.pdf 下载链接。

基于python大数据的台风灾害分析及预测系统

基于Python大数据的热门游戏推荐系统

基于python大数据的青少年网络使用情况分析及预测系统

2026版基于python大数据的电影分析可视化系统

基于Python大数据的的电商用户行为分析系统

基于python大数据技术的医疗数据分析与研究

基于python大数据深度学习的酒店评论文本情感分析系统

Python SQLAlchemy模块：从入门到实战的数据库操作指南

基于python大数据的的海洋气象数据可视化平台

基于Python大数据的主流汽车价格分析可视化系统

相关课程

更多

Python Web开发基础

Python爬虫实战

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

对象存储实战指南-试读

OpenAnolis 龙蜥操作系统开源社区技术创新白皮书

使用CNFS搭建弹性Web服务

推荐镜像

更多

python-release

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！