【发布时间】:2015-12-11 23:18:22
【问题描述】:
我是第一次使用 Twython 库。它给了我一个字典类型的对象“数据”。这本词典的字段中有['user'],它是一个子词典。
我创建了这个字典的列表:
tweets=[]
#Given an object data
...some kind of loop....
tweets.append(data)
一旦我有了它,我就将它转换为数据框:
output = pd.DataFrame(tweets)
这对于第一级词典工作正常,但对于第二级词典,它将它们全部转换为字符串。
理想情况下,我想做的是:
output['user']['screen_name'][1]
而不是
user_info = ast.literal_eval(output['user'][1]))
print user_info['screen_name']
并以本机方式访问数据。目前,我必须使用类似 ast 的东西首先逐行将其转换为另一个字典。有没有更有效的方法来做到这一点?
【问题讨论】:
-
你为什么要把它放到 DataFrame 中?
-
因为我想稍微练习一下我的panda技能,而且把同一个字典的N行的数据集放到一个dataframe中似乎合乎逻辑?接受建议,DF 实现不是我的最终目标,我只是想对从 twitter 获取的数据进行一些操作。
-
我想还有一个更广泛的问题,即如何处理嵌套字典,或者这根本不适合数据框?
-
没有数据样本不容易回答。但是,您是否尝试过this question 的答案中描述的类似方法?
-
资料比较长,我试着做个demo吧。我相信我已经尝试了那里提出的一些方法,但没有取得任何成功。明天有空会更新
标签: python dictionary pandas dataframe