开发者社区> 问答> 正文

CSV尺寸不同的生产线

我正在尝试将PDF银行摘录转换为csv。我是python的新手,但是我设法从pdf中提取文本。我以类似以下内容结束:

AMAZON 23/12/2019 15:40 -R $ 100,00 R $ 400,00信用 某些餐厅23/12/2019 14:00 -R $ 10,00 R $ 500信用 从John Doe收到22/12/2019 15:00 R $ 510 R $ 500,00 03游戏22/12/2019 15:00 R $ 10 R $ 10,00借记卡

我想要这个输出: AMAZON; 23/12/2019; -100,00 Some Restaurant; 23/12/2019; -10,00 从John Doe收到; 22/12/2019; 510 03游戏; 22/12/2019; 10

第一个字段的大小不同,我不需要时间和货币格式。我不需要最后2个字段。

到目前为止,我有以下代码(仅从PDF中提取文本):

import pdfplumber
import sys

url = sys.argv[1]
pdf = pdfplumber.open(url)
pdf_pages = len(pdf.pages)

for i in range(pdf_pages):
    page = pdf.pages[(i)]
    text = page.extract_text()
    print(text)
pdf.close()

谁能给我一些指示?

展开
收起
几许相思几点泪 2019-12-24 21:15:18 708 0
0 条回答
写回答
取消 提交回答
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载