【发布时间】:2011-08-25 05:12:18
【问题描述】:
我需要将一个充满 pdf 的文件夹合并到一个文件中。但是,它们必须按特定顺序组合。文件名示例如下:
WR_Mapbook__1.pdf
WR_Mapbook__1a.pdf
WR_Mapbook__2.pdf
WR_Mapbook__2a.pdf
WR_Mapbook__3.pdf
WR_Mapbook__3a.pdf
etc...
它们在 Windows 资源管理器中的排序方式是我需要将它们添加到单个文件中的方式。但是,我的脚本首先添加所有“a”文件,然后添加没有“a”的文件。为什么这样做?如何对其进行排序以便以我想要的方式添加文件?
请参阅下面的代码。谢谢!
from pyPdf import PdfFileWriter, PdfFileReader
import glob
outputLoc = "K:\\test\\pdf_output\\"
output = PdfFileWriter()
pdfList = glob.glob(r"K:\test\lidar_MB_ALL\*.pdf")
pdfList.sort
print pdfList
for pdf in pdfList:
print pdf
input1 = PdfFileReader(file(pdf, "rb"))
output.addPage(input1.getPage(0))
# finally, write "output" to document-output.pdf
outputStream = file(outputLoc + "WR_Imagery_LiDar_Mapbook.pdf", "wb")
output.write(outputStream)
print ("adding " + pdf)
outputStream.close()
【问题讨论】:
标签: python sorting pdf-generation