【发布时间】:2016-08-07 00:09:07
【问题描述】:
我正在尝试读取一个看起来像这样的 JSON 文件。它们是推文的时间戳。当我用我的代码读入文件时,它以一个大字符串的形式出现。有没有办法让他们分开。当我使用 str.split() 时,它会拆分所有内容。有没有我可以加载或取出它以使这个更容易
"Sat Aug 06 23:54:24 +0000 2016""Sat Aug 06 23:54:24 +0000 2016""Sat Aug 06 23:54:24 +0000 2016""Sat Aug 06 23:54:24 +0000 2016"
这就是我的阅读方式
q = 'Trump'
twitter_stream = twitter.TwitterStream(auth=twitter_api.auth)
stream = twitter_stream.statuses.filter(track=q)
for tweet in stream:
print (type(tweet))
tweet = tweet['created_at']
with open('dates.json', 'a') as outfile:
json.dump(tweet, outfile, indent=4)
这就是我目前正在尝试的方法
with open('dates.json', 'rb') as f:
data = f.readlines()
我希望它们按日期分隔,以便我可以将它们转换为时间序列图
编辑/更新:现在我有了这个,但是流只是不断地收集推文而没有停止。如何让它停止收集推文并将 JSON 数据转储到文件中。手动还是自动
q = 'Trump'
twitter_stream = twitter.TwitterStream(auth=twitter_api.auth)
stream = twitter_stream.statuses.filter(track=q)
dates = [tweet['created_at'] for tweet in stream]
with open('dates.json', 'a') as outfile:
json.dump(dates, outfile, indent=4)
【问题讨论】: