【问题标题】:scrape google codeSEARCH刮谷歌代码搜索
【发布时间】:2010-03-24 18:22:43
【问题描述】:

问:关于从 Google 代码搜索结果中自动提取所有项目文件的编程工具/脚本的建议? 注意:该问题专门用于代码搜索: http://www.google.com/codesearch 而不是已经具有存储库访问权限的“谷歌代码”。

动机:一个开源项目的官网早就没了,没有任何联系的线索追上去重振它。项目文件仍然可用,但仅在谷歌代码搜索结果中(目前)。可惜文件太多了,可以手动一一剪切和粘贴。

欢迎所有想法,谢谢!

编辑:到目前为止找到的最接近的参考: groups.google.com/group/google-code-search/browse_thread/thread/f643b42934ea75c9/974f99c5cd907e8e#974f99c5cd907e8e

【问题讨论】:

    标签: web-scraping web-crawler


    【解决方案1】:

    听起来您需要为此使用wget

    【讨论】:

      猜你喜欢
      • 2011-12-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-08-19
      • 1970-01-01
      • 2019-09-28
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多