【发布时间】:2019-10-31 08:07:24
【问题描述】:
获取如下数据集(来自df.head()的输出)
individual states
1 Alaska, Hawaii
2 Hawaii, Alaska
3 Kansas, Iowa, Maryland
4 New Jersey, Newada
5 Newada, New Jersey
如果我跑
df['states'].str.get_dummies(sep=',')
我得到以下内容
Hawaii Iowa Maryland New Jersey Newada Alaska Hawaii Kansas New Jersey Newada
0 1 0 0 0 0 1 0 0 0 0
1 0 0 0 0 0 1 1 0 0 0
2 0 1 1 0 0 0 0 1 0 0
3 0 0 0 0 1 0 0 0 1 0
4 0 0 0 1 0 0 0 0 0 1
注意重复(重复)的列。多列出现的值不同,所以我不能只删除它们。问题出在哪里,我该怎么做?提前致谢!
【问题讨论】:
标签: pandas