开发者社区> 问答> 正文

Python PDFminer读取PDF内容速度慢是怎么回事?如何解决?:报错

根据网上的Python读取PDF的相关资料,TZ发现了PDFminer这个Python库,但是当我将其用来读取一个约300MB左右,页数在4000左右的PDF文件时,速度真心感人,一个小时大概读取了2000页,也就是一半的内容,这肯定不是我所预期的样子。时间太太太长了。求Python大佬教教小弟如何优化这个问题。万分感谢

下图为PDFminer读取PDF代码

展开
收起
kun坤 2020-06-07 21:32:35 1269 0
1 条回答
写回答
取消 提交回答
  • 在一个月后的今天,把这个问题解决了。换掉了这个三方库,使用的XPD来读取PDF,速度比这个快太多了。

    ######大哥,XPD是什么库,具体名字叫什么?######

    多核

    ######谢谢你的回答,请问多核是什么意思呢?多进程读取么?还是?求大佬赐教
    2020-06-07 21:32:39
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载