Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具,支持 50 多种 PDF 操作,包括合并、拆分、转换、压缩等,同时提供多语言支持和企业级功能,满足个人和企业用户的多样化需求。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🛡️ “还在用WPS处理敏感文件?这个开源神器把PDF工作站搬进你电脑:50+功能全免费,数据不出本地!”

大家好,我是蚝油菜花。你是否经历过——

  • 🚨 公司合同上传第三方工具,冷汗直冒怕泄密
  • 🚨 在线PDF转换器突然收费,多年文档被绑架
  • 🚨 急需调整PDF页序时,发现所有工具都要注册...

今天介绍的 Stirling-PDF ,用开源力量重塑文档安全!这个基于Docker的本地化PDF工具箱,集合合并/拆分/OCR/签名等53项专业功能,所有操作在本地内存完成,关闭浏览器即数据蒸发。金融从业者用它处理机密财报,开发者搭建私有文档中台——你的数据主权,早该回归自己手中!

🚀 快速阅读

Stirling-PDF 是一款功能强大的本地化 PDF 编辑工具,支持 50 多种操作和多语言界面。

  1. 核心功能:支持 PDF 合并、拆分、转换、压缩、OCR 等操作,提供自定义流水线和 API 集成。
  2. 技术原理:基于 Docker 部署,利用 LibreOffice 和 Tesseract OCR 等工具实现高效 PDF 处理。

Stirling-PDF 是什么

stirling-home

Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具,专为需要高效处理 PDF 文件的用户设计。它支持 50 多种 PDF 操作,包括合并、拆分、转换、压缩、OCR 等,能够满足个人和企业用户的多样化需求。

Stirling-PDF 的设计注重隐私和安全性,所有文件和 PDF 数据仅在客户端或服务器内存中临时存在,任务完成后会立即删除,确保用户数据的安全性。此外,它还支持多语言界面,目前已支持 39 种语言,覆盖全球大部分用户的需求。

Stirling-PDF 的主要功能

  • PDF 操作:支持合并、拆分、旋转、重新排序、压缩等 50 多种操作。
  • 转换功能:支持 PDF 与图片、Word、HTML、Markdown 等格式的相互转换。
  • 安全功能:支持添加水印、密码保护、权限设置、PDF 签名等。
  • 高级功能:提供 OCR 文字识别、PDF/A 转换、元数据编辑等功能。
  • 企业功能:支持单点登录(SSO)、数据库备份与导入等企业级功能。

Stirling-PDF 的技术原理

  • Docker 部署:基于 Docker 容器化技术,确保跨平台兼容性和易部署性。
  • LibreOffice 集成:利用 LibreOffice 实现 PDF 与其他格式的转换。
  • Tesseract OCR:通过 Tesseract OCR 提供高效的 PDF 文字识别功能。
  • API 支持:提供 API 接口,方便与其他系统集成。

如何运行 Stirling-PDF

Stirling-PDF 提供了 Docker 镜像,方便用户快速部署和运行。本文将详细介绍如何通过 docker rundocker-compose 命令运行 Stirling-PDF 容器,并提供相关配置和参数的说明。

Stirling-PDF 的版本选择

Stirling-PDF 提供了三种不同的版本,分别适用于不同的硬件配置:

版本 最新标签
Fat latest-fat
Standard latest
Ultra Lite latest-ultra-lite
  • Fat:适用于高性能硬件,包含所有功能和语言支持。
  • Standard:标准版本,适用于大多数用户。
  • Ultra Lite:轻量级版本,适合低性能硬件。

如果需要最新功能和更新,建议使用 latest 标签。

1. 使用 docker run 运行容器

以下是通过 docker run 命令运行 Stirling-PDF 容器的示例:

docker run -d \
  --name stirling-pdf \
  -p 8080:8080 \
  -v "./StirlingPDF/trainingData:/usr/share/tessdata" \
  -v "./StirlingPDF/extraConfigs:/configs" \
  -v "./StirlingPDF/customFiles:/customFiles/" \
  -v "./StirlingPDF/logs:/logs/" \
  -v "./StirlingPDF/pipeline:/pipeline/" \
  -e DOCKER_ENABLE_SECURITY=false \
  -e LANGS=en_GB \
  stirlingtools/stirling-pdf:latest
AI 代码解读

参数解释

  • -d:以后台模式运行容器。
  • --name stirling-pdf:为容器指定名称。
  • -p 8080:8080:将容器的 8080 端口映射到主机的 8080 端口。
  • -v:挂载主机目录到容器中,用于持久化数据。
    • ./StirlingPDF/trainingData:/usr/share/tessdata:挂载 OCR 语言数据目录。
    • ./StirlingPDF/extraConfigs:/configs:挂载额外配置文件目录。
    • ./StirlingPDF/customFiles:/customFiles/:挂载自定义文件目录。
    • ./StirlingPDF/logs:/logs/:挂载日志目录。
    • ./StirlingPDF/pipeline:/pipeline/:挂载流水线文件目录。
  • -e:设置环境变量。
    • DOCKER_ENABLE_SECURITY=false:禁用安全功能(根据需求调整)。
    • LANGS=en_GB:设置支持的语言(例如英式英语)。

2. 使用 docker-compose 运行容器

如果更倾向于使用 docker-compose,可以通过以下配置文件运行 Stirling-PDF 容器。

docker-compose.yml 文件示例

version: '3.3'
services:
  stirling-pdf:
    image: stirlingtools/stirling-pdf:latest
    ports:
      - '8080:8080'
    volumes:
      - ./StirlingPDF/trainingData:/usr/share/tessdata # Required for extra OCR languages
      - ./StirlingPDF/extraConfigs:/configs
      - ./StirlingPDF/customFiles:/customFiles/
      - ./StirlingPDF/logs:/logs/
      - ./StirlingPDF/pipeline:/pipeline/
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - LANGS=en_GB
AI 代码解读

启动命令

在包含 docker-compose.yml 文件的目录下运行以下命令:

docker-compose up -d
AI 代码解读

3. 高级配置

如果需要进一步自定义配置,例如添加额外的语言支持或调整流水线配置,可以参考Stirling-PDF 高级配置文档

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

目录
打赏
0
6
6
0
380
分享
相关文章
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
465 11
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
18天前
|
Ubuntu下部署及操作Docker技巧
以上就是在Ubuntu下部署及操作Docker的具体步骤。但这只是冰山一角,Docker的魅力远不仅如此。你可以将其视为存放各种工具的小箱子,随时随地取用,极大地提升工作效率。你也可以私人订制,适应不同的开发环境,就像一个拥有各种口味冰淇淋的冰箱,满足各种各样的需求。好了,现在你已经掌握了基本的Docker运用技巧,快去尝试使用吧!记住,沉浸在探索中,你会找到无尽的乐趣和满满的收获。
81 23
【工具教程】批量PDF和图片OCR识别指定区域文字自动改图片名字,多个区域一次性批量识别改名批量重命名
本内容介绍了一款用于企业档案、医院病历及办公文件管理的图片和PDF文字识别工具。通过框选识别区域,软件可批量提取关键信息,实现文件重命名或导出为表格,极大提升管理效率。支持图片与PDF两种模式,操作简单,适用于合同、病历、报告等场景。提供详细步骤指导,包含区域设置、文件导入、批量处理及结果校验等功能。
114 8
揭秘 Microsoft.Docker.SDK:让容器开发更轻松的强大工具揭秘
随着云计算和容器技术的快速发展,`Docker` 已经成为容器化技术的事实标准。`Microsoft` 作为 `Docker` 的主要支持者和参与者,推出了 `Microsoft.Docker.SDK`,旨在帮助开发者更轻松地进行容器开发。本文将深入揭秘 Microsoft.Docker.SDK 的功能、使用方法以及它在容器开发中的应用。
79 12
大模型文件Docker镜像化部署技术详解
大模型文件Docker镜像化部署技术详解
195 2
自学软硬件第755 docker容器虚拟化技术youtube视频下载工具
docker容器虚拟化技术有什么用?怎么使用?TubeTube 项目使用youtube视频下载工具
|
1月前
|
在Docker上部署Ollama+AnythingLLM完成本地LLM Agent部署
通过以上步骤,您可以成功在Docker上部署Ollama和AnythingLLM,实现本地LLM Agent的功能。在部署过程中,确保环境和配置正确,以避免不必要的问题。希望本文能够帮助您顺利完成部署,并在本地环境中高效地使用LLM模型。
650 8
Docker——阿里云服务器使用Docker部署python项目全程小记
本文记录了我在阿里云服务器上使用Docker部署python项目(flask为例)的全过程,在这里记录和分享一下,希望可以给大家提供一些参考。
179 0
Linux服务器部署docker windows
在当今软件开发中,Docker成为流行的虚拟化技术,支持在Linux服务器上运行Windows容器。流程包括:1) 安装Docker;2) 配置支持Windows容器;3) 获取Windows镜像;4) 运行Windows容器;5) 验证容器状态。通过这些步骤,你可以在Linux环境中顺利部署和管理Windows应用,提高开发和运维效率。
191 1

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等