【发布时间】:2019-01-02 09:33:09
【问题描述】:
我正在使用 imagemagick 处理 pdf 文件到图像,但是这个特定的文件被处理成一些非常乱的东西 为了简化我做的事情很简单
convert file.pdf out.jpg
只是一个想法是它是文本 pdf 和图像 pdf 的混合,这可能会导致麻烦。你能帮我吗? 文本中的文档页面被转换为这种乱码,实际扫描的最后一页很好
这是原文的链接 file
编辑:我发现没有文本和扫描组合的文件也会导致问题,实际上是包含文本数据的文件,而不是扫描的图像。所以问题是如何设置 imagemagick 以将纯文本的 pdf 转换为图像而不获得此输出
【问题讨论】:
-
您的 ImageMagick 版本和平台是什么?它包括Ghostscript吗?如果是这样,Ghostscript 的版本是什么。如果这不是最新的,请更新 Ghostscript。你有安装 Ghostscript 字体吗?在 Mac OSX Sierra 上使用带有 GS 9.23 的 ImageMagick 6.9.10.7 Q16 对我来说效果很好。我得到 5 个结果页面作为单独的 JPG 文件。
-
我在 ubuntu 18.04.1 上有 ImageMagick 6.9.7-4 Q16 和 ghostscript 9.22 的版本,如果我尝试更新系统,则会显示这些是最新版本。实际上,当我尝试在我的开发机器上进行转换时,imagemagic 6.8.9-9 Q16 和 ghostscript 9.18 都可以正常工作
-
可能是ghostscript版本。我在 9.23。也许 9.22 有一个错误。最坏的情况,将 Ghostscript 降级到 9.22 之前的版本,例如 9.18,看看是否可以修复它。在 Linux 上,与 ImageMagick 版本相关的日期比版本更重要,因为 Linux 通常会在不更改版本日期的情况下打补丁。因此,还要检查您的两个系统上的版本日期。
-
是的,它是 ghostscript,但实际上在 ubuntu 18 上以标准方式降级存在问题,而且 9.21 也无法正常工作......所以我手动安装了 9.23,一切正常。感谢您指点我尝试不同的版本
标签: imagemagick imagemagick-convert