【发布时间】:2014-07-13 03:00:45
【问题描述】:
我需要以编程方式分析和组合几个(数百个)PDF 文档,并以专门的方式将页面链接在一起。每个 PDF 在链接所属的每个位置都包含文本,指示它应该链接到什么。我正在使用pdfminer 来提取链接应该在的位置和文本;现在我只需要实际创建这些链接。
我做了一些研究并得出结论,PyPDF2 应该可以做到这一点。无论如何,有一个看似简单的addLink 方法声称可以完成工作。我就是无法让它工作。
from PyPDF2 import PdfFileWriter
from PyPDF2.pdf import RectangleObject
out = PdfFileWriter()
out.insertBlankPage(800, 1000)
out.insertBlankPage(800, 1000)
# rect = [400, 400, 600, 600] # This doesn't seem to work either
rect = RectangleObject([400, 400, 600, 600])
out.addLink(0, 1, rect) # link from first to second page
with open(r'C:\temp\test.pdf', 'wb') as outf:
out.write(outf)
上面的代码生成了一个漂亮的两页 PDF,其中没有任何内容,至少据我所知。有谁知道这可能是如何实现的?或者至少表明我哪里出错了?
只要库是免费许可的,解决方案就不必使用 PyPDF2。严格来说,Python 甚至不是必需的,但如果不使用另一种语言,就可以将它融入我当前的结构中。
【问题讨论】:
标签: python pdf pdf-generation pypdf