【发布时间】:2011-07-26 14:37:34
【问题描述】:
我需要从一些 PDF 文档中提取数据(使用 Java)。我需要知道什么是最简单的方法。
我试过 iText。这对我的需求来说相当复杂。此外,我想它不适用于商业项目。所以这不是一个选择。我还尝试了 PDFBox,并遇到了各种NoClassDefFoundError 错误。
我在 Google 上搜索并发现了其他几个选项,例如 PDF Clown、jPod,但我没有时间尝试所有这些库。我依靠社区通过 Java 阅读 PDF 的经验。
请注意,我不需要创建或操作 PDF 文档。我只需要从具有中等布局复杂性的 PDF 文档中提取文本数据。
请建议从 PDF 文档中提取文本的最快和最简单的方法。谢谢。
【问题讨论】: