【问题标题】:Tweepy API Search Results and Rate limitsTweepy API 搜索结果和速率限制
【发布时间】:2014-12-20 05:27:06
【问题描述】:

我是 Python 和 Tweepy 的新手,我已经玩了一段时间了。我通过进取心发现了这个piece of code。我一直在用它来填充带有推文的 Excel 文件,效果很好。

但我有几个问题:我可以使用这个循环获得多少条推文?或者更具体地说,当我最近几天获得前 2000 条时,这些推文是针对我搜索的标签发布的所有推文吗?还是和Streaming API一样,我可以得到所有推文的1%?

而且我并不真正了解我的速率限制。使用上述代码获得 10.000 条推文需要多少次查询?是不是每页 100 条推文,所以需要 100 页 = 100 个查询?

【问题讨论】:

    标签: python twitter tweepy


    【解决方案1】:

    当我得到最后几天的前 2000 条时,这些推文是针对我搜索的标签发布的所有推文吗?还是和 Stream API 一样,我可以得到所有推文的 1%?

    两者都没有。 Twitter 在过去两周内提供推文。但是,并非所有关键字都一样:

    搜索 API 不是所有推文的完整索引,而是最近推文的索引。目前该索引包括 6-9 天的推文。

    此外,不能保证所有最近的推文都会被 Twitter 搜索 API 索引:

    重要的是要知道 Search API 关注的是相关性而不是完整性。这意味着搜索结果中可能会丢失一些推文和用户。

    此信息来自Twitter Search API's general information page,很好看,可以回答很多问题。

    而且我不太了解我的速率限制。使用上述代码获得 10.000 条推文需要多少次查询?

    Twitter API 有一个chart 解释不同资源的速率限制。速率限制以 15 分钟为单位。对于搜索,每 15 分钟窗口有 180 个请求。既然你可以得到100-count per request,理论上你每15分钟可以收集180*100 = 18k条推文。 但是,您只能收集 ​​Twitter 为您提供的尽可能多的推文(请参阅 6-9 天的收录)。您可以收集的推文数量取决于您的关键字和 Twitter 提供的内容。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-03-08
      • 1970-01-01
      • 2022-08-19
      • 1970-01-01
      • 2013-03-28
      • 1970-01-01
      相关资源
      最近更新 更多