【问题标题】:dumping PDF document ( *.pdf) to Text?将 PDF 文档 (*.pdf) 转储为文本?
【发布时间】:2010-11-27 13:28:07
【问题描述】:

我在这里(代码部分)获得了一些很大的帮助,用于将 word doc 转储为文本。现在我 在将 PDF 文档 (*.pdf) 转储为文本时寻求帮助?我正在使用 Delphi 2010。我更喜欢非组件、非 Active-X 解决方案....因为此代码将合并到我自己的组件中。

谢谢

【问题讨论】:

    标签: delphi pdf delphi-2010


    【解决方案1】:

    据我所知,您有两个免费选项。

    首先,xpf 包中有一个命令行工具,可从http://www.foolabs.com/xpdf免费获得

    然后,http://mupdf.com 项目中的另一个命令行工具

    两者都可以从 Delphi 轻松调用。我使用 xpdf 中的 pdftotext.exe 文件没有任何问题。

    【讨论】:

    • 谢谢,我会检查一下并回复您!
    • 我都下载了。 XPDF 看起来很有希望,但我似乎无法弄清楚配置文件是如何工作的。我查看了 Sample xpdfrc 文件,但没有看到任何显示输入或输出文件配置的内容。 mudpf 工具在我看来就像它带有一个 gui 应用程序和一些命令行工具(其中没有一个是 pdfshow、pdfextract、pdfinfo - 网页描述的) - 谢谢!
    【解决方案2】:

    PDFtext 可以做到。不过,您必须支付 57 美元并部署额外的 dll。

    【讨论】:

    • 这可能是一个可以接受的答案,但我会再等一会儿,看看其他人是否有免费的选择。谢谢。
    • 我应该补充一点,我正在使用 PDFtext 并且工作正常。
    • 我想这是我唯一的选择!
    【解决方案3】:

    我一直在使用 QuickPDF 库在 PDF 文件中查找文本。我使用函数

    GetPageText(ExtractOptions: Integer): string;
    

    从每个页面中获取文本,以便对其进行搜索。 如果对 ExtractOptions 使用 0,它将以可读格式返回文本。它不是免费的,但图书馆和文档都非常好。此外,他们的网站上还托管了一个非常活跃的社区博客。

    【讨论】:

    • 谢谢,我忘了在我的问题中提及,但我希望有一个免费或开源的解决方案。如果我找不到免费或单一来源的解决方案,我一定会检查一下。
    【解决方案4】:

    我没试过,但TSMPDFReader 对你来说似乎没问题:没有 DLL,没有 Activex,没有外部组件。 不是免费的,但 35 欧元也不算贵。

    我使用 Scalabium 的其他组件:非常棒的支持。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-11-12
      • 1970-01-01
      • 2018-01-07
      • 2017-01-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-09-25
      相关资源
      最近更新 更多