开源项目:一行代码,批量 PDF 转 Word 轻松搞定!

简介: 程序员晚枫分享了 `popdf` 的新功能:支持批量 PDF 转 Word!只需简单代码,即可轻松实现单文件或批量转换。`input_path` 和 `output_path` 参数让操作更便捷,适合处理大量 PDF 文件。作为开发者,晚枫致力于解决技术小痛点,欢迎体验并反馈。项目地址:[https://github.com/CoderWanFeng/popdf](https://github.com/CoderWanFeng/popdf)

大家好,我是程序员晚枫。今天我要给大家带来一个超实用的好消息——popdf 已经支持批量 PDF 转 Word 了!是不是很激动?别急,我来手把手教你玩转这个功能。

pip install popdf

1. 一行代码搞定单文件转换

之前我就说过,popdf 的核心就是简单暴力。只需要一行代码,你就能轻松把 PDF 转成 Word:

from popdf import pdf2docx

pdf2docx(
    input_file=r"D://程序员晚枫的文件夹/single_file.pdf",
    output_file=r"D://程序员晚枫的文件夹/single_file.docx"
)

是不是很简单?小白也能秒上手!

2. 批量转换,轻松搞定

现在,popdf 更是升级了!支持批量转换啦!只需要换两个参数,就能一次性处理一堆 PDF 文件。以下是关键参数的讲解:

  • input_fileoutput_file:这组参数用来处理单个文件,适合零散的 PDF 转换。
  • input_pathoutput_path:这组参数才是今天的主角!input_path 是 PDF 文件夹路径,output_path 是输出 Word 文件夹路径。只要把 PDF 文件丢进输入文件夹,运行代码,Word 文件就自动出来了。

批量转换的代码示例如下:

from popdf import pdf2docx

pdf2docx(
    input_path=r"D://程序员晚枫的文件夹/pdf_folder/",  # PDF 文件夹路径
    output_path=r"D://程序员晚枫的文件夹/docx_folder/"  # 输出 Word 文件夹路径
)

是不是超方便?再也不用手动一个个转换了!

3. 代码示例,直接上手

为了让大家更直观地感受,我再贴一个完整的代码示例:

from popdf import pdf2docx

# 单文件转换
pdf2docx(
    input_file=r"D://程序员晚枫的文件夹/single_file.pdf",
    output_file=r"D://程序员晚枫的文件夹/single_file.docx"
)

# 批量转换
pdf2docx(
    input_path=r"D://程序员晚枫的文件夹/pdf_folder/",
    output_path=r"D://程序员晚枫的文件夹/docx_folder/"
)

记住,路径一定要改成你自己的文件夹路径,否则程序会骂你哦!

4. 关于我:程序员晚枫

我是程序员晚枫,一个热爱技术、爱折腾的开发者。平时喜欢写一些实用的工具和库,帮助大家解决开发中的小痛点。popdf 就是其中之一,希望能帮到更多人。

如果你对这个工具感兴趣,或者有任何问题,欢迎在评论区留言!告诉我你的使用体验,或者提出你想要的功能,说不定下个版本就实现了哦!

快来试试吧,保证让你惊艳!有问题留言区见! 😄

GitHub 项目地址:https://github.com/CoderWanFeng/popdf

相关文章
|
1月前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
906 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
1月前
|
程序员 开发者
PDF 转图片,一行代码搞定!批量支持已上线!
大家好,我是程序员晚枫!今天为大家介绍 `popdf` 的新功能:PDF 转图片,支持批量操作!只需一行代码即可完成单文件转换,批量处理也只需简单修改参数。工具简单易用,小白也能快速上手。`popdf` 是我开发的实用工具之一,旨在解决开发中的小痛点。欢迎访问 GitHub 项目地址 (<https://github.com/CoderWanFeng/popdf>),提出建议或加入开源小组,一起交流进步!快来体验吧,保证让你惊艳! 😄
82 16
|
2月前
|
人工智能 文字识别 自然语言处理
1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!
Kreuzberg 是一个基于 Python 的文本提取库,支持从 PDF、图像、Office 文档等 20+ 格式中提取文本内容。采用 MIT 开源协议,具备本地处理、异步架构、智能 OCR 等特性,特别适合需要隐私保护的文档处理场景。
|
3月前
|
存储 人工智能 API
PDF to Podcast:英伟达开源黑科技!PDF 秒转播客/有声书,告别阅读疲劳轻松学习!
NVIDIA推出的PDF to Podcast工具,基于大型语言模型和文本到语音技术,将PDF文档转换为生动的音频内容。
195 14
PDF to Podcast:英伟达开源黑科技!PDF 秒转播客/有声书,告别阅读疲劳轻松学习!
|
2月前
|
文字识别 BI API
3.4K star!全能PDF处理神器开源!文档转换/OCR识别一键搞定
PDF-Guru 是一款开箱即用的全能型PDF处理工具,支持跨平台文档转换、智能OCR识别、多格式解析等核心功能。项目采用模块化架构设计,提供简洁的Web界面和API接口,开发者可快速集成到现有系统中。
126 1
|
4月前
|
人工智能 文字识别 异构计算
NVIDIA-Ingest:英伟达开源智能文档提取及结构化工具,支持 GPU 加速和并行处理
NVIDIA-Ingest 是英伟达开源的智能文档提取工具,支持 PDF、Word、PPT 等多种格式,提供并行处理和 GPU 加速,适用于企业内容管理和生成式应用。
189 18
NVIDIA-Ingest:英伟达开源智能文档提取及结构化工具,支持 GPU 加速和并行处理
|
3月前
|
人工智能 JSON 搜索推荐
猫步简历 - 开源免费AI简历生成器 | 一键导出PDF/JSON
猫步简历是一款免费开源的AI简历生成器,帮助用户轻松创建独特、专业的简历。支持导出超高清PDF、图片、JSON等多种格式,并提供AI智能创作、润色和多语种切换等功能。拥有海量模板、高度定制化模块及完善的后台管理系统,助力求职者脱颖而出。官网:https://maobucv.com,GitHub开源地址:https://github.com/Hacker233/resume-design。
816 10
|
4月前
|
人工智能 文字识别 自然语言处理
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
Vision Parse 是一款开源的 PDF 转 Markdown 工具,基于视觉语言模型,能够智能识别和提取 PDF 中的文本和表格,并保持原有格式和结构。
560 19
Vision Parse:开源的 PDF 转 Markdown 工具,结合视觉语言模型和 OCR,识别文本和表格并保持原格式
|
5月前
|
人工智能 文字识别 数据挖掘
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
MarkItDown 是微软开源的多功能文档转换工具,支持将 PDF、PPT、Word、Excel、图像、音频等多种格式的文件转换为 Markdown 格式,具备 OCR 文字识别、语音转文字和元数据提取等功能。
825 9
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
|
5月前
|
XML C# 数据格式
一个.NET开源、免费、功能强大的 PDF 处理工具
一个.NET开源、免费、功能强大的 PDF 处理工具
122 8

热门文章

最新文章