【问题标题】:Downloading earliest 3200 tweets with Tweepy?用 Tweepy 下载最早的 3200 条推文?
【发布时间】:2016-02-25 00:36:17
【问题描述】:

我一直在尝试在 Twitter 上下载一些用户的完整时间线。虽然我能够从用户那里下载最新的 3,200 条推文,但我想知道是否有人成功地以相反的时间顺序下载了时间线——即从第一条推文到第 3,200 条?

我能做的最好的事情就是通过 Twitter 的高级搜索功能在我的浏览器中查看这些推文。但是甚至没有办法将这些推文复制粘贴到我可以分析它们的 csv 中。

感谢您提供的任何帮助!

【问题讨论】:

    标签: python twitter tweepy


    【解决方案1】:

    我认为您无法获得比最近 3,200 条更早的推文。

    这是 REST API 中Twitter's underlying GET statuses/user_timeline API endpoint 的限制:

    此方法最多只能返回 3,200 条用户最近的推文。用户对其他状态的本机转推包含在此总数中,无论在请求此资源时是否将include_rts 设置为false

    【讨论】:

    • 我害怕那个。看起来即使我将 Web 界面用于他们的高级搜索功能,我什至无法使用 beautifulsoup 将其从 html 中解析出来:-(
    【解决方案2】:

    我今天在 GitHub 上提交了一个机器人TwEater,目的是收集早期数据超过 3200 条用于文本挖掘任务。希望对您有所帮助。

    【讨论】:

    • 酷,我去看看!
    猜你喜欢
    • 1970-01-01
    • 2015-11-08
    • 1970-01-01
    • 2023-04-08
    • 2014-12-21
    • 1970-01-01
    • 2016-09-20
    • 2018-10-20
    • 2017-12-22
    相关资源
    最近更新 更多