【问题标题】:Extract images from PDF in high resolution with Python使用 Python 从 PDF 中提取高分辨率图像
【发布时间】:2020-12-28 10:47:01
【问题描述】:

我已经设法使用以下代码从几个 PDF 页面中提取图像,但分辨率非常低。有办法调整吗?

import fitz    
pdffile = "C:\\Users\\me\\Desktop\\myfile.pdf"
doc = fitz.open(pdffile)
for page_index in range(doc.pageCount):
    page = doc.loadPage(page_index)  
    pix = page.getPixmap()
    output = "image_page_" + str(page_index) + ".jpg"
    pix.writePNG(output)

我也尝试过使用代码 here 并将 if pix.n

【问题讨论】:

    标签: python pdf pymupdf


    【解决方案1】:

    正如本期 PyMuPDF 所述,您必须使用矩阵: issue on Github.

    给出的例子是:

    zoom = 2    # zoom factor
    mat = fitz.Matrix(zoom, zoom)
    pix = page.getPixmap(matrix = mat, <...>)
    

    问题中还指出,如果您不使用可能会导致分辨率变低的矩阵,则默认分辨率为 72 dpi。

    【讨论】:

      猜你喜欢
      • 2013-06-02
      • 2020-06-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-11-20
      • 2011-09-30
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多