【发布时间】:2023-03-22 19:19:01
【问题描述】:
在我的数据框中,我有一个分类变量,我想将其转换为虚拟变量。但是,此列有多个值,用逗号分隔:
0 'a'
1 'a,b,c'
2 'a,b,d'
3 'd'
4 'c,d'
最终,我希望每个可能的离散值都有二进制列;换句话说,最终列数等于原始列中唯一值的数量。我想我必须使用 split() 来获取每个单独的值,但不确定之后该怎么做。非常感谢任何提示!
编辑:额外的扭曲。列具有空值。作为对评论的回应,以下是所需的输出。谢谢!
a b c d
0 1 0 0 0
1 1 1 1 0
2 1 1 0 1
3 0 0 0 1
4 0 0 1 1
【问题讨论】:
-
您能否提供您给出的示例的预期输出
标签: python pandas split dummy-variable