【发布时间】:2011-08-15 20:11:39
【问题描述】:
我有一个问题,我试图打开一个用 Quark 8.51 编码的 pdf 并使用 itext 从文档中提取文本,但是当它打开时只有一大堆乱码和无意义的词。有人有什么建议吗?
【问题讨论】:
-
你能贴出你用来提取文本的代码吗?
我有一个问题,我试图打开一个用 Quark 8.51 编码的 pdf 并使用 itext 从文档中提取文本,但是当它打开时只有一大堆乱码和无意义的词。有人有什么建议吗?
【问题讨论】:
您是否在 IText 邮件列表中询问过或尝试过任何其他提取库,例如 jpedal 或 PdfBox?
【讨论】:
如果试图阅读除纯文本以外的任何内容,它将无法正常工作。可能导致问题的其他原因是编码
【讨论】: