【发布时间】:2013-05-15 04:30:50
【问题描述】:
我有几千个 PDF 需要根据文件名合并。
命名为:
Lastname, Firstname_12345.pdf
如果有其他页面,我们的软件不会覆盖或附加,而是在 pdf 中附加一个数字/日期时间:
Lastname, Firstname_12345_201305160953344627.pdf
对于所有没有第二个(或第三个)pdf 的脚本不需要接触。但是,对于所有具有倍数的,它们需要合并到一个新文件*_merged.pdf?并删除了原件。
我尽了最大的努力,这就是我目前所拥有的。
#! /bin/bash
# list all pdfs to show shortest name first
LIST=$(ls -r *.pdf)
for x in "$LIST"
# Remove .pdf extension. merge pdfs. delete originals.
do
y=${x%%.*}
pdftk "$y"*.pdf cat output "$y"_merged.pdf
find "$y"*.pdf -type f ! -iname "*_merged.pdf" -delete
done
这个脚本在一定程度上有效。它将合并和删除原始文件,但它没有任何内容可以跳过不需要附加任何内容的文件,并且当我在包含多个测试文件的文件夹中运行它时,它会在一个文件之后停止。谁能指出我正确的方向?
【问题讨论】:
-
能否提供样品名称列表?