【发布时间】:2010-10-23 04:28:39
【问题描述】:
我正在尝试在 Google 缓存中进行搜索,因此我需要触发此查询:
http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news
并从页面中获取一些内容,例如时间戳。但是当我使用 curl (ruby) 执行此操作时,它会出现权限被拒绝错误,即抓取被阻止,这是意料之中的。
那么,有没有办法搜索谷歌缓存(API 或某种变通方法抓取)并提取一些信息,如时间戳?
【问题讨论】:
标签: ruby-on-rails google-search-api