【问题标题】:get variable value outside the for loop在for循环外获取变量值
【发布时间】:2021-06-30 07:41:04
【问题描述】:

我想阅读整个 pdf 内容。 我使用了 PyPDF2 并使用 for 循环通过 numpgaes 对象迭代页面。 但我的问题是我只能在 for 循环中获取整个文档文本。 但我想在循环之外使用它。我应该怎么办? 我的代码如下所示。

import PyPDF2

sample_pdf = open(r'/home/user/Desktop/123.pdf', mode='rb')
pdfdoc = PyPDF2.PdfFileReader(sample_pdf)

x = ''
for i in range(pdfdoc.numPages):
    current_page = pdfdoc.getPage(i)
    text = current_page.extractText()
    x = text

我在变量文本中获取整个 pdf 内容,但在 x 变量中我只获取最后一页内容。

【问题讨论】:

    标签: python-3.x for-loop pdf pypdf2


    【解决方案1】:

    您是否尝试过使用列表?

    import PyPDF2
    
    sample_pdf = open(r'/home/user/Desktop/123.pdf', mode='rb')
    pdfdoc = PyPDF2.PdfFileReader(sample_pdf)
    
    x = []
    for i in range(pdfdoc.numPages):
        current_page = pdfdoc.getPage(i)
        text = current_page.extractText()
        x.append(text)
    

    【讨论】:

    • 是的,它可以工作,但我希望字符串中的“x”不在列表中。
    【解决方案2】:

    字符串的添加给了我预期的结果。

    import PyPDF2
    
    sample_pdf = open(r'/home/user/Desktop/123.pdf', mode='rb')
    pdfdoc = PyPDF2.PdfFileReader(sample_pdf)
    
    
    x = ''
    for i in range(pdfdoc.numPages):
        current_page = pdfdoc.getPage(i)
        text = current_page.extractText()
        x += str(text)
        
    
    print(x)
    
       
    

    【讨论】:

      猜你喜欢
      • 2017-09-30
      • 1970-01-01
      • 1970-01-01
      • 2016-05-06
      • 2020-02-21
      • 1970-01-01
      • 1970-01-01
      • 2020-04-05
      相关资源
      最近更新 更多