【问题标题】:Itext7: render PDF page to imageItext7:将 PDF 页面渲染为图像
【发布时间】:2017-09-08 05:14:04
【问题描述】:

我可以使用 IText 7 将 PDF 页面呈现为真实的图像对象(例如 BufferedImage)吗?

【问题讨论】:

  • 这在 iText、iText 5 和 iText 7 中从未得到支持。在 iText Group,我们对这个古老的用例不感兴趣。
  • 请注意,截至今年,iText 现在有一个名为 pdfRender 的插件,用于这个确切的用例。 (免责声明:在撰写此评论时,我是 iText 员工)

标签: image pdf itext itext7 pdf-conversion


【解决方案1】:

如果您真的想这样做,请考虑使用 GhostScript。

Ghostscript 是一套基于 Adob​​e 解释器的软件 Systems 的 PostScript 和便携式文档格式 (PDF) 页面 描述语言。它的主要目的是光栅化或 呈现此类页面描述语言文件,用于显示或 打印文档页面,以及 PostScript 和 PDF 文件。 -- 维基百科

正如布鲁诺所说,iText 一般不会进入渲染域。

但是,请记住,在您完成此“文档”后,您正在为希望使用此“文档”的人创造什么样的情境。文本提取将不再起作用(除非您对其进行 OCR),您将失去任何搜索功能或元信息等。

【讨论】:

  • 我不会使用这种转换来显示给最终用户。我想要一个可以在内部处理的缓冲图像,以确定特定区域是否有可见内容。 (如果我尝试另一种方法,请参阅我的另一篇文章:stackoverflow.com/questions/46104097/…
  • 这听起来与我们为内部测试所做的类似。我们运行一些代码来生成文档,然后根据 pdf 验证它们以检查结构差异。如果存在结构差异,我们将两个 pdf 都转换为图像并进行视觉比较。
  • 这能适应我的问题吗?如果是这样,我该怎么做。这么深层次的itext和pdf是很难理解的
  • 这个想法是使用 GhostScript 将 pdf 转换为图像(或一系列图像,每页一个),然后您可以使用常规 Image.IO 将它们加载到 Java 中
猜你喜欢
  • 2014-09-18
  • 1970-01-01
  • 2018-04-07
  • 2012-12-25
  • 1970-01-01
  • 1970-01-01
  • 2013-07-31
  • 2014-02-03
相关资源
最近更新 更多