【发布时间】:2021-06-30 07:41:04
【问题描述】:
我想阅读整个 pdf 内容。 我使用了 PyPDF2 并使用 for 循环通过 numpgaes 对象迭代页面。 但我的问题是我只能在 for 循环中获取整个文档文本。 但我想在循环之外使用它。我应该怎么办? 我的代码如下所示。
import PyPDF2
sample_pdf = open(r'/home/user/Desktop/123.pdf', mode='rb')
pdfdoc = PyPDF2.PdfFileReader(sample_pdf)
x = ''
for i in range(pdfdoc.numPages):
current_page = pdfdoc.getPage(i)
text = current_page.extractText()
x = text
我在变量文本中获取整个 pdf 内容,但在 x 变量中我只获取最后一页内容。
【问题讨论】:
标签: python-3.x for-loop pdf pypdf2