【问题标题】:imagemagick convert pdf with text(no scan) to gibberishimagemagick 将带有文本(无扫描)的 pdf 转换为乱码
【发布时间】:2019-01-02 09:33:09
【问题描述】:

我正在使用 imagemagick 处理 pdf 文件到图像,但是这个特定的文件被处理成一些非常乱的东西 为了简化我做的事情很简单

convert file.pdf out.jpg

只是一个想法是它是文本 pdf 和图像 pdf 的混合,这可能会导致麻烦。你能帮我吗? 文本中的文档页面被转换为这种乱码,实际扫描的最后一页很好

这是原文的链接 file

编辑:我发现没有文本和扫描组合的文件也会导致问题,实际上是包含文本数据的文件,而不是扫描的图像。所以问题是如何设置 imagemagick 以将纯文本的 pdf 转换为图像而不获得此输出

【问题讨论】:

  • 您的 ImageMagick 版本和平台是什么?它包括Ghostscript吗?如果是这样,Ghostscript 的版本是什么。如果这不是最新的,请更新 Ghostscript。你有安装 Ghostscript 字体吗?在 Mac OSX Sierra 上使用带有 GS 9.23 的 ImageMagick 6.9.10.7 Q16 对我来说效果很好。我得到 5 个结果页面作为单独的 JPG 文件。
  • 我在 ubuntu 18.04.1 上有 ImageMagick 6.9.7-4 Q16 和 ghostscript 9.22 的版本,如果我尝试更新系统,则会显示这些是最新版本。实际上,当我尝试在我的开发机器上进行转换时,imagemagic 6.8.9-9 Q16 和 ghostscript 9.18 都可以正常工作
  • 可能是ghostscript版本。我在 9.23。也许 9.22 有一个错误。最坏的情况,将 Ghostscript 降级到 9.22 之前的版本,例如 9.18,看看是否可以修复它。在 Linux 上,与 ImageMagick 版本相关的日期比版本更重要,因为 Linux 通常会在不更改版本日期的情况下打补丁。因此,还要检查您的两个系统上的版本日期。
  • 是的,它是 ghostscript,但实际上在 ubuntu 18 上以标准方式降级存在问题,而且 9.21 也无法正常工作......所以我手动安装了 9.23,一切正常。感谢您指点我尝试不同的版本

标签: imagemagick imagemagick-convert


【解决方案1】:

ghostscript 9.22 有问题, 更新到 9.23 有帮助

【讨论】:

    猜你喜欢
    • 2018-01-10
    • 1970-01-01
    • 2017-12-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-11-03
    • 2017-02-25
    相关资源
    最近更新 更多