【发布时间】:2013-06-08 13:15:05
【问题描述】:
我需要渲染或获取特定 PDF 文件中的所有图像。如何使用 Ghostscript 或 ImageMagick 实现这一点?
【问题讨论】:
标签: pdf imagemagick ghostscript poppler
我需要渲染或获取特定 PDF 文件中的所有图像。如何使用 Ghostscript 或 ImageMagick 实现这一点?
【问题讨论】:
标签: pdf imagemagick ghostscript poppler
你不能用 Ghostscript 来做,但你可以用 Poppler 或 XPDF 的名为 pdfimages 的命令行工具来做:
pdfimages -j some.pdf subdir/image-prefix
所有图像现在都将位于subdir/,命名为image-prefix-0001.jpg、image-prefix-0002.jpg ...
-j 参数将使命令尝试直接提取 JPEG。如果无法创建 JPEG,它将创建 PNM 或 PPM,您始终可以使用 ImageMagick 进行转换:
convert subdir/image-prefix-0033.ppm subdir/image-prefix-0033.jpeg
【讨论】:
[ghostscript] + [pdf],我会尽力回答。还请说明您的请求的目的是什么。节省文件大小?删除图像中包含的信息?还是?
magick mogrify -format jpg *.ppm
如果不给自己编写一个 Ghostscript 设备,你当然不能在 Ghostscript 中做到这一点。
我怀疑你也可以用 ImageMagick 做到这一点。
您看过 PDFtk 吗?
如果您使用的是 Windows,那么会出现一个快速的 Google:
http://www.somepdf.com/some-pdf-image-extract.html
在 Linux 上:
https://askubuntu.com/questions/150100/extracting-images-from-a-pdf
【讨论】:
提取 1 个页面的示例:
gs -q -dBATCH -dNOPAUSE -sDEVICE=pnggray -d300 -dFirstPage=1 -dLastPage=1 -sOutputFile=1.tiff in.pdf
【讨论】: