【问题标题】:How best to search a website and retrieve data in PHP?如何最好地在 PHP 中搜索网站和检索数据?
【发布时间】:2010-11-11 14:22:54
【问题描述】:

尝试学习更多 PHP。这就是我所追求的。

基本上,我想搜索一个网站并将数据返回到我自己的网站。

  1. 在表单中添加一些关键字。
  2. 使用这些关键字查询诸如 monster.com 之类的网站以获取与输入的关键字相匹配的结果。
  3. 获取该数据并将其返回到我自己的网站。

这样的事情有多难?我承认上述大纲过于简单,但您可以提供的任何提示都非常感谢。

【问题讨论】:

    标签: php search web web-scraping


    【解决方案1】:

    如果您要查询的网站具有为此类功能指定的 API,那么您就很轻松了。只需调用 API 的相应搜索函数即可。

    如果您查询的站点没有 API,您仍然可以使用正确的参数通过 HTTP GET 搜索站点。然后,您只需要使用您的脚本和一些正则表达式函数从文件中搜索搜索结果。

    这里有一个关于screen scraping with PHP 的小教程。希望这会对您有所帮助。这样做的问题在于,一般来说,如果网站无法轻松访问他们的数据,他们可能不希望您这样做。

    【讨论】:

    • 感谢您的回复和链接。不幸的是,我想测试的网站没有 API,但我会看看会发生什么。
    【解决方案2】:

    输入 Yahoo 查询语言 (yql)。这是一项服务,可让您使用诸如 xpath 之类的东西从网站获取数据并将其转换为易于使用的 xml 或 json 格式。该语言的结构类似于 sql(因此得名)。

    我已经将它用于其他网站,为没有它的网站构建 rss 提要,而且它很容易学习。

    http://developer.yahoo.com/yql/

    【讨论】:

      猜你喜欢
      • 2010-09-27
      • 1970-01-01
      • 1970-01-01
      • 2010-11-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多