【发布时间】:2019-10-21 14:35:22
【问题描述】:
我正在尝试从用户的时间线上实时提取推文。然后我想对这些推文进行一些分析。阅读文档后,我似乎需要为这个用例使用 tweepy.Stream 。我做了以下事情:
stream.filter(follow='25073877')
但 Twitter 的过滤器 API 声明如下:
- 用户创建的推文。
- 用户转发的推文。
- 回复用户创建的任何推文。
- 转发用户创建的任何推文。
- 手动回复,无需按回复即可创建 按钮(例如“@twitterapi 我同意”)。
这似乎会返回大量与我的用例无关的推文。我是否必须使用这种方法,然后按屏幕名称过滤才能仅获取真实用户的推文?这似乎根本不对。
替代方案似乎是 api.user_timeline 类,但它不是流式 API。因此,我是否使用此 API 并每秒点击一次?我似乎找不到合适的例子来说明如何最好地完成我的用例。
【问题讨论】:
标签: python twitter data-science tweepy