【问题标题】:Parallelize PDF concatenation using GNU Parallel and Ghostscript?使用 GNU Parallel 和 Ghostscript 并行化 PDF 连接?
【发布时间】:2021-06-12 09:10:41
【问题描述】:

这可以连接 PDF (source):

gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=out.pdf in1.pdf in2.pdf

但连接数百个 PDF 时速度很慢。

有没有办法并行化 PDF 连接,例如以某种方式使用 GNU Parallel

【问题讨论】:

  • 可能。暂时忽略 GNU Parallel,请显示您希望并行运行的前 3 个 gs 命令,以便我们识别参数的模式。
  • @MarkSetchell 我确信可以构造一些递归的分而治之的函数,以便gs 的每次执行只连接两个PDF。
  • 请说明前 3 个命令是什么,没有 GNU Parallel。并且还要指出PDF是否都在同一个目录中。
  • @MarkSetchell 为什么是 3?而且,是的,它们都在同一个目录中。
  • 我仍然不知道您是否希望将所有 100 多个连接到一个 PDF 中,或者您是否只想通过配对将数量减少一半,或者与哪些配对,或者如何输出文件应命名为...

标签: pdf parallel-processing concatenation ghostscript gnu-parallel


【解决方案1】:

你会说这是作弊:

pdftk *pdf cat output /tmp/my.pdf

但它比gs 快得多。

【讨论】: