python 读出pdf文件中的内容

简介: python 读出pdf文件中的内容
import pyttsx3
import PyPDF2

用到pychram这个ide 要导入上述两个库

完整代码如下

要改的地方是下方文件的路径 前面加个r用于转义

import pyttsx3
import PyPDF2
pdfReader=PyPDF2.PdfReader(open(r'C:\Users\Administrator\Desktop\test_加水印.pdf','rb'))#文件路径
speaker=pyttsx3.init()
for page_num in range(pdfReader.numPages):#全部读完
    text=pdfReader.getPage(page_num).extractText()
    speaker.say(text)
    speaker.runAndWait()
speaker.stop()
相关文章
|
7天前
|
存储 Python
Python文件编码概念详解
Python文件编码概念详解
16 1
|
8天前
|
数据挖掘 程序员 数据安全/隐私保护
解锁PDF潜力:9个Python库让你的文档处理更高效
程序员晚枫分享了Python处理PDF的9个第三方库,包括PyPDF2、pdfrw、ReportLab、pikepdf、pdfplumber、pdfminer.six、PyMuPDF、popdf和borb,各具优缺点。选择时需考虑应用场景、功能需求、库的维护状态和开源协议。例如,pdfplumber擅长内容提取,而ReportLab和PyMuPDF适用于创建和修改内容。
|
19小时前
|
Java Python
Python的文件对象
【6月更文挑战第5天】
7 4
|
1天前
|
人工智能 数据挖掘 Python
【Python实用技能】建议收藏:自动化实现网页内容转PDF并保存的方法探索(含代码,亲测可用)
【Python实用技能】建议收藏:自动化实现网页内容转PDF并保存的方法探索(含代码,亲测可用)
|
1天前
|
数据采集 存储 数据处理
Python 技巧分享:NEF文件的元数据提取
使用 Python 爬虫从网上抓取 NEF 图像文件,通过代理 IP 避免 IP 被封,利用 `requests`, `beautifulsoup4`, `Pillow` 和 `piexif` 库解析和提取元数据。代码示例展示了如何配置亿牛云爬虫代理,下载 NEF 文件并打印其元数据信息。这种方法可应用于各种网络资源的爬取与分析,提高爬虫的稳定性和效率。
Python 技巧分享:NEF文件的元数据提取
|
2天前
|
存储 Python
21.Python 操作文件
21.Python 操作文件
|
2天前
|
Python
【Python 训练营】N_14 文件查找和替换
【Python 训练营】N_14 文件查找和替换
|
3天前
|
Unix 关系型数据库 API
Python OS 文件/目录方法
Python OS 文件/目录方法
|
3天前
|
Python
Python File(文件) 方法
Python File(文件) 方法
|
4天前
|
Python
Python 文件I/O
Python 文件I/O