【发布时间】:2015-04-15 12:27:49
【问题描述】:
当我在 PDF 查看器中打开 PDF 时,我会在实际文档的左侧看到一系列书签。那里显示的信息似乎并不构成文档实际内容的一部分:它没有打印出来,它没有出现在特定页面上。
如何使用 Java 提取这些书签?
【问题讨论】:
-
当您谈论 PdfBox 时,为什么这个问题会被标记为 iText 问题。请在视图左侧的文档查看器中完成句子我已查看pdf。您指的是书签面板吗?您指的是带有标记 PDF 标记的面板吗?元数据通常不会显示在 PDF 查看器的左侧。选择文件 > 文档属性时会显示元数据。
-
嗨@BrunoLowagie。非常遗憾。是的,我确实在书签面板中看到了一些信息。我尝试使用 PdfBox 和 Itext,但我无法获得这些信息。此外,书签中的信息也不存在于 Pdf 文本中的任何地方
-
PDFBox 的查看器不显示元数据。您可以使用 PDFDebugger 命令行工具查看它(如果这是您的问题)。 pdfbox.apache.org/1.8/commandline.html#pdfDebugger你的问题真的不清楚,关于你是在问“如何”还是关于错误/不需要的行为。你真的应该解决这个问题来解释你想做什么/你做了什么/发生了什么。
-
书签中的信息不必出现在文本中。这些是分开的事情。 PDFBox 确实有读取书签的方法:svn.apache.org/repos/asf/pdfbox/trunk/examples/src/main/java/…
-
非常感谢@Tilman Hausherr 我能够完成任务。
标签: java pdf pdf-parsing