【发布时间】:2010-11-27 13:28:07
【问题描述】:
我在这里(代码部分)获得了一些很大的帮助,用于将 word doc 转储为文本。现在我 在将 PDF 文档 (*.pdf) 转储为文本时寻求帮助?我正在使用 Delphi 2010。我更喜欢非组件、非 Active-X 解决方案....因为此代码将合并到我自己的组件中。
谢谢
【问题讨论】:
标签: delphi pdf delphi-2010
我在这里(代码部分)获得了一些很大的帮助,用于将 word doc 转储为文本。现在我 在将 PDF 文档 (*.pdf) 转储为文本时寻求帮助?我正在使用 Delphi 2010。我更喜欢非组件、非 Active-X 解决方案....因为此代码将合并到我自己的组件中。
谢谢
【问题讨论】:
标签: delphi pdf delphi-2010
据我所知,您有两个免费选项。
首先,xpf 包中有一个命令行工具,可从http://www.foolabs.com/xpdf免费获得
然后,http://mupdf.com 项目中的另一个命令行工具
两者都可以从 Delphi 轻松调用。我使用 xpdf 中的 pdftotext.exe 文件没有任何问题。
【讨论】:
PDFtext 可以做到。不过,您必须支付 57 美元并部署额外的 dll。
【讨论】:
我一直在使用 QuickPDF 库在 PDF 文件中查找文本。我使用函数
GetPageText(ExtractOptions: Integer): string;
从每个页面中获取文本,以便对其进行搜索。 如果对 ExtractOptions 使用 0,它将以可读格式返回文本。它不是免费的,但图书馆和文档都非常好。此外,他们的网站上还托管了一个非常活跃的社区博客。
【讨论】:
我没试过,但TSMPDFReader 对你来说似乎没问题:没有 DLL,没有 Activex,没有外部组件。 不是免费的,但 35 欧元也不算贵。
我使用 Scalabium 的其他组件:非常棒的支持。
【讨论】: