【问题标题】:Any API to search Google Cache?搜索 Google 缓存的任何 API?
【发布时间】:2010-10-23 04:28:39
【问题描述】:

我正在尝试在 Google 缓存中进行搜索,因此我需要触发此查询:

http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news

并从页面中获取一些内容,例如时间戳。但是当我使用 curl (ruby) 执行此操作时,它会出现权限被拒绝错误,即抓取被阻止,这是意料之中的。

那么,有没有办法搜索谷歌缓存(API 或某种变通方法抓取)并提取一些信息,如时间戳?

【问题讨论】:

    标签: ruby-on-rails google-search-api


    【解决方案1】:

    我没有得到任何 API,但我可以在 rails 中使用 hpricotnokogiri 来抓取它(Rails 中的 curl 给出权限被拒绝错误)。一旦我弄清楚如何使用这些 gem 从上述 URL 中提取时间戳,我将提供代码。

    谁有更好的解决方案?

    【讨论】:

      【解决方案2】:

      【讨论】:

      • “SOAP 搜索 API 不再可用。”
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-12-11
      • 1970-01-01
      • 2021-07-31
      • 1970-01-01
      相关资源
      最近更新 更多