Linux中如何优雅的批量合并、拆分、加密pdf文件

简介: 在windows中合并个pdf还要让你冲会员,真的是狗。linux下有没有一款工具能完成对pdf的合并、切分的工具呢?

痛点

在windows中合并个pdf还要让你冲会员,真的是狗。linux下有没有一款工具能完成对pdf的合并、切分的工具呢?

有:

PDFtk

功能

     * Merge PDF Documents or Collate PDF Page Scans
       * Split PDF Pages into a New Document
       * Rotate PDF Documents or Pages
       * Decrypt Input as Necessary (Password Required)
       * Encrypt Output as Desired
       * Fill PDF Forms with X/FDF Data and/or Flatten Forms
       * Generate FDF Data Stencils from PDF Forms
       * Apply a Background Watermark or a Foreground Stamp
       * Report PDF Metrics, Bookmarks and Metadata
       * Add/Update PDF Bookmarks or Metadata
       * Attach Files to PDF Pages or the PDF Document
       * Unpack PDF Attachments
       * Burst a PDF Document into Single Pages
       * Uncompress and Re-Compress Page Streams
       * Repair Corrupted PDF (Where Possible)

3db7d592785645dc98fae22ab4d35642.png

安装

OS Version

CentOS Linux release 7.8.2003 (Core)

安装依赖

yum install -y gcc gcc-c++ libXrandr gtk2 libXtst libart_lgpl

安装 pdftk 2.02

yum localinstall https://www.linuxglobal.com/static/blog/pdftk-2.02-1.el7.x86_64.rpm

pdftk 使用

合并pdf

pdftk ./PDF/*.pdf cat output merge.pdf

也支持枚举文件合并

pdftk ./PDF/1.pdf ./PDF/2.pdf cat output merge.pdf

切分pdf

将PDF 拆分成单页并将其数据转储到 doc_data.txt

Splits a single input PDF document into individual pages

pdftk merge.pdf burst

目前没找到按照大小切分的选项,这个选项打散成每页之后再自己按需求merge

压缩pdf

pdftk ./merge.pdf cat output merged-copmress.pdf compress

压缩效果不明显,建议使用convert 、gs

品质和大小的trade-off

Pixelated (lossy):

convert input.pdf -compress Zip output.pdf

Unpixelated (lossless, but may display slightly differently):

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dBATCH  -dQUIET -sOutputFile=output.pdf input.pdf

issue

1、本地执行内存不足warning

GC Warning: Repeated allocation of very large block (appr. size 139264):
        May lead to memory leak and poor performance.

如何将pdftk迁移到其他机器上执行

直接copy二进制文件过去,无法执行

pdftk ./PDF/*.pdf cat output merge.pdf
pdftk: error while loading shared libraries: libgcj.so.10: cannot open shared object file: No such file or directory

如何将该二进制命令所需库文件复制一份?

ldd命令可以完成

ldd /bin/pdftk | egrep -o '/lib.*\.[0-9]'
/lib64/libgcj.so.1
/lib64/libstdc++.so.6
/lib64/libm.so.6
/lib64/libgcc_s.so.1
/lib64/libc.so.6
/lib64/libpthread.so.0
/lib64/librt.so.1
/lib64/libdl.so.2
/lib64/libz.so.1
/lib64/ld-linux-x86-64.so.2

使用如下小脚本将pdftk依赖的so文件copy到性能好一点的机器上去.

list=$(ldd /bin/pdftk | egrep -o '/lib.*\.[0-9]')
for i in $list; do scp -p "$i" ip:/lib64/; done

libgcj.so.10 仍然缺失

发现该文件并没有被copy过来,或许是这个正则写的有点问题。后来发现并不是,因为在/usr目录

解决: 使用find找到然后copy过去。没有外网真的很痛苦。

find /usr -name "libgcj.so*"
/usr/lib64/libgcj.so.10

如何改造这个正则以匹配到

 ⚡ root@localhost  /tmp  ldd /bin/pdftk | egrep -o '*/lib.*\.[0-9]'
/lib64/libgcj.so.1
/lib64/libstdc++.so.6
/lib64/libm.so.6
/lib64/libgcc_s.so.1
/lib64/libc.so.6
/lib64/libpthread.so.0
/lib64/librt.so.1
/lib64/libdl.so.2
/lib64/libz.so.1
/lib64/ld-linux-x86-64.so.2
 ⚡ root@localhost  /tmp  ldd /bin/pdftk | egrep -o '*/lib.*\.[0-9]+'
/lib64/libgcj.so.10
/lib64/libstdc++.so.6
/lib64/libm.so.6
/lib64/libgcc_s.so.1
/lib64/libc.so.6
/lib64/libpthread.so.0
/lib64/librt.so.1
/lib64/libdl.so.2
/lib64/libz.so.1
/lib64/ld-linux-x86-64.so.2

f016d03acd5745229d11c619d32c408c.png

windows GUI的限制

free版本只能合并、拆分

pro版本split, merge, rotate, watermark, stamp and secure PDF pages and documents 。3,99$

5e900f02e2d24c828b3b217fd6ccd546.png

目录
相关文章
|
10天前
|
Linux
linux中查看某个文件夹下文件的个数和大小
这篇文章介绍了在Linux系统中使用各种命令(如`stat`、`wc`、`du`和`ls`)来查看文件夹下文件的个数和大小的方法。
50 4
linux中查看某个文件夹下文件的个数和大小
|
2月前
|
Linux
Linux下使用ls查看文件颜色全部为白色的解决方法,以及Linux中文件颜色介绍
Linux下使用ls查看文件颜色全部为白色的解决方法,以及Linux中文件颜色介绍
104 2
|
5天前
|
安全 Linux 数据安全/隐私保护
探索Linux操作系统的文件权限管理
【9月更文挑战第29天】在数字世界中,文件权限管理如同保护我们隐私的锁。本文将带你了解如何在Linux系统中设置和管理文件权限,确保你的数据安全。我们将一起学习如何通过命令行工具来控制文件访问,就像学习一门新语言一样有趣。准备好了吗?让我们一起开启这场技术之旅!
|
7天前
|
Linux
深入理解Linux中的cp命令:文件与目录的复制利器
深入理解Linux中的cp命令:文件与目录的复制利器
|
8天前
|
Linux Shell
10-9|linux上统计文件中单词次数
10-9|linux上统计文件中单词次数
|
8天前
|
存储 Linux Shell
常用vim命令和vim基本使用及Linux用户的管理,用户和组相关文件
这篇文章介绍了Vim编辑器的基本使用、常用命令和模式,以及Linux系统中用户和组的管理方法,包括用户和组相关文件如/etc/passwd、/etc/shadow和/etc/group的说明。
常用vim命令和vim基本使用及Linux用户的管理,用户和组相关文件
|
7天前
|
Python
Python办公自动化:提取pdf文件中的图片
Python办公自动化:提取pdf文件中的图片
10 0
|
1月前
|
Ubuntu Linux Shell
Linux系统命令 安装和文件相关命令
本文档详细介绍了Linux系统中的常用命令,包括软件安装卸载命令如`dpkg`和`apt-get`,压缩与解压命令如`gzip`、`bzip2`和`xz`,以及`tar`命令用于打包和解包。此外还介绍了文件分割命令`split`,文件操作命令如`cat`、`head`、`tail`、`more`、`less`等,管道命令和`wc`、`grep`、`find`、`cut`、`sort`、`uniq`、`diff`等实用工具。最后,文档还讲解了文件属性相关的命令如`chmod`、`chown`、`chgrp`以及创建硬链接和软链接的`ln`命令。
|
10天前
pdf文件转化为png照片 (PyMuPDF下面的fitz)
pdf文件转化为png照片 (PyMuPDF下面的fitz)
|
2月前
|
移动开发 资源调度 JavaScript
Vue移动端网页(H5)预览pdf文件(pdfh5和vue-pdf)
这篇文章介绍了在Vue移动端网页中使用`pdfh5`和`vue-pdf`两个插件来实现PDF文件的预览,包括滚动查看、缩放、添加水印、分页加载、跳转指定页数等功能。
193 0
Vue移动端网页(H5)预览pdf文件(pdfh5和vue-pdf)
下一篇
无影云桌面