【发布时间】:2019-04-12 05:06:46
【问题描述】:
所以我目前正在尝试从 Twitter 帐户中挖掘推文,但我想排除转推,以便我可以为我的项目获取 200 条推文数据。目前我有一个工作代码来挖掘数据馈送,但仍然包含 Re-Tweets。我已经确定要排除您需要添加的 Re-Tweets
-RT 在代码中,但我根本不知道在哪里,因为我对编程很陌生。
(目前使用 Python 的 Twitter API (Tweepy) 和使用 Spyder 的 Python 3.6。)
import tweepy
from tweepy import OAuthHandler
import pandas as pd
consumer_key = 'consumer_key'
consumer_secret = 'consumer_secret'
access_token = 'access_token'
access_secret = 'access_secret'
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)
api = tweepy.API(auth)
api = tweepy.API(auth)
screen_name='screen_name'
tweets = api.user_timeline(screen_name, count=200)
save=['']*len(tweets)
for i in range(len(tweets)):
save[i]=tweets[i].text
print(tweets[i].text)
data = pd.DataFrame(save)
data.to_csv("results.csv")
任何人都可以帮助我,最好是完整的代码部分以删除转推。非常感谢
【问题讨论】:
-
要回答您的问题,您需要过滤结果以排除您的转发,
Tweepy不提供此功能,因此您要么放弃 tweepy 并自己实现 API,要么您过滤掉。祝你好运