【发布时间】:2018-04-30 19:44:42
【问题描述】:
我有一个 pandas 数据框,其中一列是一个带有嵌套元组的元组。嵌套元组有两个现有的 id。我想将总元组中的每个元素分解成新的附加列。到目前为止,这是我的 df:
df
id1 id2 tuple_of_tuple
0 a e ('cat',100,('a','f'))
1 b f ('dog',100,('b','g'))
2 c g ('cow',100,('d','h'))
3 d h ('tree',100,('c','e'))
我试图在一小部分数据上实现下面的代码,它似乎有效。每个提取/分解的元素都有新的附加列。
df[['Link_1', 'Link_2','Link_3','Link_4']] = df['tuple_of_tuple'].apply(pd.Series)
但是当我将它应用于整个数据集时,我收到错误“ValueError:列必须与键长度相同”。 (我应该提一下,周围散落着几个 NaN,因为 tuple_of_tuple 列的行中的整个条目将只是 NaN)。我该如何解决这个问题?
【问题讨论】:
标签: python pandas dataframe tuples