【发布时间】:2021-04-26 00:43:46
【问题描述】:
问题:我有一个页码数组,需要将空白页插入或合并到原始 pdf 中。示例)[1、3、5、8、10]。我需要这些页面是空白的,然后原始文档的页码会增加。
我有这个 Python 脚本在 pdf 文件中搜索表示字母结尾的特定文本。每个字母的页数不同。使用 PyPDF2,我尝试使用目录中的单个空白页 pdf 进行 merge()、insertBlankPage()、addPage()、addBlankPage。我遇到的问题是空白页覆盖了原始页面。需要空白的第一页有效,但下一页不正确。似乎空白页是写在现有页面的顶部而不是在页码处插入。
如何在数组中列出的页码处插入空白页?这是代码。页面的输出数组不需要是字符串;它被转换为字符串以带入另一个程序。如果我可以使用 Python 添加空白页,则页码数组不需要是字符串。
import PyPDF2, re
pdfIn = open('sample_letter.pdf', 'rb')
pdfFile = PyPDF2.PdfFileReader(pdfIn)
NumPages = pdfFile.getNumPages()
string = "Text I am searching for."
separator = ', '
mystring = ""
def end_of_letter():
pages = []
for page in range(NumPages):
pgObj = pdfFile.getPage(page)
text = pgObj.extractText()
match = re.search(string, text)
if match:
pages.append(str(page + 1))
mystring = separator.join(pages)
print(mystring)
return mystring
end_of_letter()
【问题讨论】:
标签: python-3.x pdf pypdf2