【发布时间】:2016-02-25 00:36:17
【问题描述】:
我一直在尝试在 Twitter 上下载一些用户的完整时间线。虽然我能够从用户那里下载最新的 3,200 条推文,但我想知道是否有人成功地以相反的时间顺序下载了时间线——即从第一条推文到第 3,200 条?
我能做的最好的事情就是通过 Twitter 的高级搜索功能在我的浏览器中查看这些推文。但是甚至没有办法将这些推文复制粘贴到我可以分析它们的 csv 中。
感谢您提供的任何帮助!
【问题讨论】:
我一直在尝试在 Twitter 上下载一些用户的完整时间线。虽然我能够从用户那里下载最新的 3,200 条推文,但我想知道是否有人成功地以相反的时间顺序下载了时间线——即从第一条推文到第 3,200 条?
我能做的最好的事情就是通过 Twitter 的高级搜索功能在我的浏览器中查看这些推文。但是甚至没有办法将这些推文复制粘贴到我可以分析它们的 csv 中。
感谢您提供的任何帮助!
【问题讨论】:
我认为您无法获得比最近 3,200 条更早的推文。
这是 REST API 中Twitter's underlying GET statuses/user_timeline API endpoint 的限制:
此方法最多只能返回 3,200 条用户最近的推文。用户对其他状态的本机转推包含在此总数中,无论在请求此资源时是否将
include_rts设置为false。
【讨论】:
我今天在 GitHub 上提交了一个机器人TwEater,目的是收集早期数据超过 3200 条用于文本挖掘任务。希望对您有所帮助。
【讨论】: