【发布时间】:2017-08-09 08:53:14
【问题描述】:
我使用 iText 阅读包含 XFA 表单的 PDF 文档。 我将其转换为 XML,从 XML 读取数据并将其插入数据库。 但是,如果我在 PDF 中没有 XFA 表单,那么如何有效地从 PDF 中读取数据?
【问题讨论】:
标签: pdf itext pdf-parsing
我使用 iText 阅读包含 XFA 表单的 PDF 文档。 我将其转换为 XML,从 XML 读取数据并将其插入数据库。 但是,如果我在 PDF 中没有 XFA 表单,那么如何有效地从 PDF 中读取数据?
【问题讨论】:
标签: pdf itext pdf-parsing
这取决于您的期望。
您可以使用文本提取来检索特定页面上的所有文本。然后如何处理文本取决于您。 (例如正则表达式)
您还可以选择使用 pdf2Data,这是一个 iText7 插件,可让您将文档与模板进行匹配。 pdf2Data 似乎很合适,因为它生成 XML 文件作为其输出。
关于 pdf2Data 的更多信息可以在这里找到http://itextpdf.com/itext7/pdf2Data
【讨论】: