使用 Python 从 PDF 中提取高分辨率图像答案

【问题标题】：Extract images from PDF in high resolution with Python使用 Python 从 PDF 中提取高分辨率图像
【发布时间】：2020-12-28 10:47:01
【问题描述】：

我已经设法使用以下代码从几个 PDF 页面中提取图像，但分辨率非常低。有办法调整吗？

import fitz    
pdffile = "C:\\Users\\me\\Desktop\\myfile.pdf"
doc = fitz.open(pdffile)
for page_index in range(doc.pageCount):
    page = doc.loadPage(page_index)  
    pix = page.getPixmap()
    output = "image_page_" + str(page_index) + ".jpg"
    pix.writePNG(output)

我也尝试过使用代码 here 并将 if pix.n

【问题讨论】：

标签： python pdf pymupdf

【解决方案1】：

正如本期 PyMuPDF 所述，您必须使用矩阵： issue on Github.

给出的例子是：

zoom = 2    # zoom factor
mat = fitz.Matrix(zoom, zoom)
pix = page.getPixmap(matrix = mat, <...>)

问题中还指出，如果您不使用可能会导致分辨率变低的矩阵，则默认分辨率为 72 dpi。

【讨论】：