Stirling-PDF:一款优秀的开源PDF处理工具

简介: Stirling-PDF是一个基于spring-boot开发的开源项目,旨在提供一个功能强大的基于Docker的本地托管PDF操作工具。它使您能够对PDF文件进行多种操作,包括拆分、合并、转换、重新组织、添加图片、旋转、压缩等。该本地托管应用最初由ChatGPT完全开发,并已发展成一个功能齐全的工具,可满足您的各种PDF需求。

最近我的朋友大雄需要将一个PDF转换为Word文档。于是他在网上尝试了多个PDF转换的在线工具,但要么需要会员,要么需要登录等繁琐操作,而且我们的文件也存在泄漏等安全隐患。因此,他向我咨询是否有可私有化部署且易于使用的PDF在线工具。大雄平时也喜欢制作PPT,每当有灵感时就会创建超过60多页的ppt演示文稿。

最近我在GitHub上闲逛时,恰好发现了一个名为Stirling-PDF的项目,该项目已经获得了3.3k的星标,完全符合他的所有需求。从此,他便可以放心地转换自己的那些超长私密的PPT了。今天,我们就来分享一下这个项目,并介绍如何使用Docker Compose进行私有化部署。

storlingpdf.jpg

Stirling-PDF项目介绍

github地址: https://github.com/Frooodle/Stirling-PDF

_20231014225022.jpg

Stirling-PDF是一个基于spring-boot开发的开源项目,旨在提供一个功能强大的基于Docker的本地托管PDF操作工具。它使您能够对PDF文件进行多种操作,包括拆分、合并、转换、重新组织、添加图片、旋转、压缩等。该本地托管应用最初由ChatGPT完全开发,并已发展成一个功能齐全的工具,可满足您的各种PDF需求。

Stirling-PDF不会进行任何外部调用来进行记录或跟踪。

所有文件和PDF要么完全在客户端处理,要么在任务执行期间仅存在于服务器内存中,要么仅在任务执行期间存在于临时文件中。任何用户下载的文件在这个时候都已从服务器上删除。

项目功能:基本涵盖了我们常用的对pdf的所有操作

_20231014231217.jpg

_20231014231236.jpg

docker-compose 私有化部署

我们此处使用的镜像是作者给我们提供好的,如果家人们需要最新代码镜像的话可以根据作者在项目中给我们提供好的Dockerfile文件自行构建。

首相我们要创建docker-compose.yml文件

version: '3.3'
services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - 8070:8080
    volumes:
      - ./trainingData:/usr/share/tesseract-ocr/4.00/tessdata
      #Required for extra OCR languages
      - ./extraConfigs:/configs
      - ./customFiles:/customFiles/
    environment:
      - DOCKER_ENABLE_SECURITY=false

创建好之后我们只需要在docker-compose.yml的同级目录下执行如下启动命令

docker-compose up -d

启动之后查看日志

docker-compose logs -f

_20231014230034.jpg

如此我们的项目则启动成功了

Stirling-PDF 项目访问

部署成功之后我们在浏览器中输入地址访问 http://192.168.10.105:8070

_20231014230545.jpg

我们可以修改语言为简体中文

_20231014230742.jpg

项目也提供了api

_20231014230942.jpg

_20231014230954.jpg

我们也使用了其中的一些功能,因为功能比较多,我们此处给只列举两个示例,其余功能家人们可自行使用

  • pdf 转word

_20231014231744.jpg

_20231014231927.jpg

转换好之后它会自动在浏览器中下载转换之后的文件,转换之后的文件如下:

_20231014232300.jpg

  • 添加水印

_20231014232426.jpg

_20231014232517.jpg

添加之后的效果:

_20231014232648.jpg

总结

总的来说,Stirling-PDF是一个基于Spring Boot开发的开源项目,为用户提供了强大的基于Docker的本地托管PDF处理工具。不论是拆分、合并、转换、重新组织、添加图片、旋转还是压缩等操作,Stirling-PDF都能轻松应对。该项目最初由ChatGPT全权开发,目前已发展成为一个功能完善且广泛应用的工具,满足用户的各种PDF处理需求。

值得一提的是,Stirling-PDF非常重视用户隐私和文件安全。它不会进行任何外部调用来记录或跟踪用户操作。所有文件和PDF要么完全在客户端处理,要么在任务执行期间仅存在于服务器内存中,要么仅在任务执行期间存在于临时文件中。这保证了用户在使用过程中的安全性和隐私保护。

借助Stirling-PDF,用户可以高效处理PDF文档,享受简单、快捷、安全的操作体验。尽管该项目在某些PDF处理方面存在一些小问题,但其持续更新和完善,我们期待着它能变得更加完善。

目录
相关文章
|
5月前
|
人工智能 文字识别 自然语言处理
熊猫 OCR 识别软件下载,支持截图 OCR、PDF 识别、多语言翻译的免费全能工具,熊猫OCR识别
本文介绍了几款实用的图文识别软件,包括熊猫OCR、Umi-OCR和天若OCR_本地版。熊猫OCR功能强大,支持多窗口操作、AI找图找色、OCR识别等;Umi-OCR免费且高效,具备截图OCR、批量处理等功能;天若OCR界面简洁,适合快速文字识别。文章还提供了下载链接及软件特点、界面展示等内容,便于用户根据需求选择合适的工具。
543 36
|
7月前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
2212 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
6月前
|
人工智能 自然语言处理 安全
CodeBuddy 开发本地 PDF 转图工具
市场上的 PDF 转图片工具存在收费昂贵、功能有限、隐私安全风险等痛点,而使用 CodeBuddy 实现的本地 PDF 批量转图片工具可以有效解决这些问题。CodeBuddy 的强大编程能力让我们可以快速开发出满足需求的工具,而且工具可以在本地运行,保证了文件的隐私安全。此外,工具还支持批量处理和自定义功能,提高了工作效率。如果你也有 PDF 转图片的需求,不妨尝试使用 CodeBuddy 来实现一个属于自己的工具。
230 11
|
6月前
|
人工智能 算法 安全
使用CodeBuddy实现批量转换PPT、Excel、Word为PDF文件工具
通过 CodeBuddy 实现本地批量转换工具,让复杂的文档处理需求转化为 “需求描述→代码生成→一键运行” 的极简流程,真正实现 “技术为效率服务” 的目标。感兴趣的快来体验下把
287 10
|
7月前
|
程序员 开发者
开源项目:一行代码,批量 PDF 转 Word 轻松搞定!
程序员晚枫分享了 `popdf` 的新功能:支持批量 PDF 转 Word!只需简单代码,即可轻松实现单文件或批量转换。`input_path` 和 `output_path` 参数让操作更便捷,适合处理大量 PDF 文件。作为开发者,晚枫致力于解决技术小痛点,欢迎体验并反馈。项目地址:[https://github.com/CoderWanFeng/popdf](https://github.com/CoderWanFeng/popdf)
656 6
|
9月前
|
存储 人工智能 API
PDF to Podcast:英伟达开源黑科技!PDF 秒转播客/有声书,告别阅读疲劳轻松学习!
NVIDIA推出的PDF to Podcast工具,基于大型语言模型和文本到语音技术,将PDF文档转换为生动的音频内容。
586 14
PDF to Podcast:英伟达开源黑科技!PDF 秒转播客/有声书,告别阅读疲劳轻松学习!
|
9月前
|
人工智能 文字识别 安全
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具,支持 50 多种 PDF 操作,包括合并、拆分、转换、压缩等,同时提供多语言支持和企业级功能,满足个人和企业用户的多样化需求。
803 6
Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具
|
8月前
|
人工智能 文字识别 自然语言处理
1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!
Kreuzberg 是一个基于 Python 的文本提取库,支持从 PDF、图像、Office 文档等 20+ 格式中提取文本内容。采用 MIT 开源协议,具备本地处理、异步架构、智能 OCR 等特性,特别适合需要隐私保护的文档处理场景。
902 1
|
8月前
|
文字识别 BI API
3.4K star!全能PDF处理神器开源!文档转换/OCR识别一键搞定
PDF-Guru 是一款开箱即用的全能型PDF处理工具,支持跨平台文档转换、智能OCR识别、多格式解析等核心功能。项目采用模块化架构设计,提供简洁的Web界面和API接口,开发者可快速集成到现有系统中。
676 1
|
7月前
|
存储 JSON API
如何将 Swagger 文档导出为 PDF 文件
你会发现自己可能需要将 Swagger 文档导出为 PDF 或文件,以便于共享和存档。在这篇博文中,我们将指导你完成将 Swagger 文档导出为 PDF 格式的过程。

热门文章

最新文章