【问题标题】:Search through PDF files with PHP使用 PHP 搜索 PDF 文件
【发布时间】:2009-12-10 16:45:39
【问题描述】:

我正在尝试寻找一种在 PDF 文件中进行搜索的方法。我遇到了 PHP PDF 类,但似乎找不到任何用于读取/搜索文件流的函数。

所以,尽管我很天真,但我尝试使用 file_get_contents() 简单地获取一个流,显然它是一个类似加密的输出;)

所以我的问题是,有没有办法搜索 PDF 文件?我正在寻找纯脚本/免费/开源解决方案,而不是购买一些昂贵的商业图书馆。

【问题讨论】:

    标签: php search pdf


    【解决方案1】:

    XPDF?

    有一篇博文here 可能会有所帮助。

    似乎有一些代码 here 可以提供帮助 - 一个将 PDF 读取为纯文本的简单类。不确定它是否支持解密。

    PHP 文档中还有许多资源可以帮助您。 Click.

    FPDFFPDI 也可能有帮助。经过一些研究,这可能是您最好的选择。**

    【讨论】:

    • 谢谢,我明天去看看! +1
    • 我浏览了你所有的链接,发现上面提到的类不支持加密。所以 XPDF 似乎被遗弃了,因为我正在使用 windowsmachine 并安装了 xampp,所以我将所有文件放在 x:/xampp/apache/bin/xpdf/ 目录中。但是我无法执行您发送的博文中提到的命令。有关如何正确设置 XPDF 的任何建议? (我对网络服务器了解不多……我什至把文件放在正确的目录中了吗?)
    【解决方案2】:

    名为Sphider 的PHP 搜索引擎可以选择通过XPDF 添加PDF 搜索。然后,您可以自定义结果模板以适应您网站的其余部分(如果适用)。

    【讨论】:

    • 此选项仍需要安装其他库。 “下载并安装 pdftotext 和 catdoc 并在 conf.php 中设置位置(路径)”
    • catdoc 仅适用于 MS-Office 文件,正如我所指出的,pdftotext 是 XPDF 的一部分,并且在常见问题解答“索引 pdf 和 doc 文件”中有所提及。
    • 感谢您的回答,为您的努力+1,但这不是我想要的。谢谢。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-03-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-01-21
    • 2023-03-18
    相关资源
    最近更新 更多