【问题标题】:Pulling multiples pages of search terms from Twitter从 Twitter 中提取多页搜索词
【发布时间】:2010-10-25 09:30:10
【问题描述】:

我正在想办法通过 PHP 和 Twitter 搜索 API 提取特定搜索词的所有推文。

所以功能包括 1.包括一个搜索词 2. 从每一页中提取术语。 3. 只从上次搜索中提取新词 4. 导出到数据库或平面文件。

除了遍历多个页面之外,我对所有这些都很清楚

【问题讨论】:

    标签: php twitter


    【解决方案1】:

    twitter API 采用页码参数。在原子结果中,有链接元素,具有下一个和上一个的 rel 属性。这将是您是否应该去寻找第二页等的最佳指标。该标签的 href 属性甚至会告诉您应该请求的 URL。

    您创建的查询也需要一个 since_id 参数。您需要存储您在响应中看到的最大 id 编号,并在后续请求中使用它,这样您就不必过滤重复项。

    至于数据存储,您的选择可能最好以您计划如何处理结果为指导……如果您要进行任何查询,您可能应该将其归档到数据库中,即 MySQL。如果您只是在记录,那么平面文件应该没问题。

    【讨论】:

    • 请确保不要在任何地方使用已弃用的 since_time 参数,它会返回一些真正不需要的数据:)
    【解决方案2】:

    搜索 API 有一个 page 参数:

    页面:可选。要返回的页码(从 1 开始),最多大约 1500 个结果(基于 rpp * page。注意:有分页限制。

    示例:http://search.twitter.com/search.atom?q=devo&rpp=15&page=2

    这有帮助吗?

    【讨论】:

      【解决方案3】:

      twitter search api 带有一个页面参数:

      # 页:可选。返回的页码(从 1 开始),最大 大约 1500 个结果(基于 rpp * 页。注意:有分页限制。

      * Example: http://search.twitter.com/search.atom?q=devo&rpp=15&page=2
      

      【讨论】:

        猜你喜欢
        • 2020-11-07
        • 1970-01-01
        • 2018-07-18
        • 1970-01-01
        • 1970-01-01
        • 2014-08-18
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多