【发布时间】:2018-03-23 18:39:31
【问题描述】:
我正在尝试使用 tweepy 从 01.11.2017 到 31.01.2018 收集用户 navalny 的推文。我有我需要的第一条和最后一条推文ids,所以我尝试了以下代码:
import tweepy
consumer_key = ''
consumer_secret = ''
access_token = ''
access_token_secret = ''
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
t = api.user_timeline(screen_name='navalny', since_id = 933000445307518976, max_id = 936533580481814529)
但是,返回值是一个空列表。
这里有什么问题?
我可以获得的推文历史记录有什么限制吗?
有哪些可能的解决方案?
【问题讨论】:
-
正如贾斯汀所说,REST API 是有限的。另一种方法是进行高级搜索并废弃页面:twitter.com/…
-
@JeffProd 可以详细说明这一点,或者提供一个资源链接,我可以在其中找到有关该主题的更多信息?
-
Twitter 高级搜索:twitter.com/search-advanced - 抓取 Twitter:github.com/haccer/twint
标签: python web-scraping tweepy