【发布时间】:2016-10-02 20:12:42
【问题描述】:
我需要在 Github 上大量搜索我的论文中的统计数据。
例如,我需要在 GitHub 上探索大量的 Android 项目,但该站点将搜索结果限制为 1000 个(例如https://github.com/search?l=java&q=onCreate&ref=searchresults&type=Code&utf8=%E2%9C%93)。同样使用 Java GitHub API,我尝试了库 org.eclipse.egit.github.core.client.GitHubClient 使用方法GitHubClient.searchRepositories(),但即使有结果的数量也是有限的。
有人知道如何获得所有结果吗?
【问题讨论】:
-
你看过GitHub Archive吗?这可能是一种无需打扰实时 GitHub 搜索 API 即可获取数据的方法,正如您发现的那样,它提供的结果数量有限,而且速度也有限制。
-
你能翻阅结果吗?你可以得到 1000 的第一个块,得到下一个块,然后重复直到你得到所有。
-
这不是Java问题,甚至不是编程问题。
-
正确,每次搜索限制为 1000 个结果和每分钟 30 个请求:developer.github.com/v3/search/#about-the-search-api
-
你的代码公开吗?
标签: github github-api