【问题标题】:how can i stream and store twitter's public timeline, particular user's tweets and tagged tweets?如何流式传输和存储 Twitter 的公共时间线、特定用户的推文和标记的推文?
【发布时间】:2010-12-16 21:17:42
【问题描述】:

我必须在一段时间内收集推文,以便使用 weka 和 tableau 工具进行分析和研究工作。是否有直接的方法以 xml 或 .csv 格式收集它们。在这方面的任何帮助将不胜感激。 我正在研究模型,以根据 Twitter 用户对推文的反应来查找他们的排名。早些时候,网站 140kit.com 的数据库集合现在无法正常工作。具体来说,我想以 xml 或 .csv 格式为用户收集推文和转推,以便通过 Weka 或 Tableau 进行进一步分析,这对我来说更恶心。我是这个领域的新手,你能提供任何博客链接来开始搜索用户的转发和标签词的 API 以及从哪里开始,因为我以前没有脚本、python 或 JSON 知识?

【问题讨论】:

标签: twitter


【解决方案1】:

当您说“从某段时间开始”时,您指的是过去还是未来?

如果您想为关键字收集过去的推文,您最多可以使用 5-7 天前的搜索 API。

如果您想收集未来某个时间开始的关键字的推文,那么您可以使用流式 API。

如果你想要某个用户过去或未来的推文,你可以使用 Rest API 中的 statuses/user_timeline 方法: http://dev.twitter.com/doc/get/statuses/user_timeline

如果您能更详细地说明您的需求,我会提供解决方案。

【讨论】:

  • 感谢您的快速响应!我正在研究模型,以根据 Twitter 用户对推文的响应来查找他们的排名。早些时候,网站 140kit.com 的数据库集合现在无法正常工作。具体来说,我想以 xml 或 .csv 格式为用户收集推文和转推,以便进一步分析。我是这方面的新手,你能提供任何博客链接来开始搜索标签词的API吗?
【解决方案2】:

也许访问 twitter 的 firehose 会有所帮助?:http://dev.twitter.com/pages/api_faq#firehose

【讨论】:

    猜你喜欢
    • 2014-05-05
    • 2017-09-24
    • 1970-01-01
    • 2018-10-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-03-30
    • 2021-07-17
    相关资源
    最近更新 更多