【发布时间】:2010-10-25 09:30:10
【问题描述】:
我正在想办法通过 PHP 和 Twitter 搜索 API 提取特定搜索词的所有推文。
所以功能包括 1.包括一个搜索词 2. 从每一页中提取术语。 3. 只从上次搜索中提取新词 4. 导出到数据库或平面文件。
除了遍历多个页面之外,我对所有这些都很清楚
【问题讨论】:
我正在想办法通过 PHP 和 Twitter 搜索 API 提取特定搜索词的所有推文。
所以功能包括 1.包括一个搜索词 2. 从每一页中提取术语。 3. 只从上次搜索中提取新词 4. 导出到数据库或平面文件。
除了遍历多个页面之外,我对所有这些都很清楚
【问题讨论】:
twitter API 采用页码参数。在原子结果中,有链接元素,具有下一个和上一个的 rel 属性。这将是您是否应该去寻找第二页等的最佳指标。该标签的 href 属性甚至会告诉您应该请求的 URL。
您创建的查询也需要一个 since_id 参数。您需要存储您在响应中看到的最大 id 编号,并在后续请求中使用它,这样您就不必过滤重复项。
至于数据存储,您的选择可能最好以您计划如何处理结果为指导……如果您要进行任何查询,您可能应该将其归档到数据库中,即 MySQL。如果您只是在记录,那么平面文件应该没问题。
【讨论】:
搜索 API 有一个 page 参数:
页面:可选。要返回的页码(从 1 开始),最多大约 1500 个结果(基于 rpp * page。注意:有分页限制。
示例:http://search.twitter.com/search.atom?q=devo&rpp=15&page=2
这有帮助吗?
【讨论】:
twitter search api 带有一个页面参数:
# 页:可选。返回的页码(从 1 开始),最大 大约 1500 个结果(基于 rpp * 页。注意:有分页限制。
* Example: http://search.twitter.com/search.atom?q=devo&rpp=15&page=2
【讨论】: