【发布时间】:2023-01-10 01:15:11
【问题描述】:
我必须对包含调查结果的数据帧执行一次性编码。
在这个数据框中,它们代表多列中的“多重响应”。例如,如果有人选择“1”和“3”,则第一列为“1”,第二列为“3”。
我需要像这样组织数据
| Quesion1 | Quesion1 |
|---|---|
| 1 | 3 |
| 2 | 4 |
| 1 | 5 |
-->
| 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|
| 1 | 0 | 1 | 0 | 0 |
| 0 | 1 | 0 | 1 | 0 |
| 1 | 0 | 0 | 0 | 1 |
我尝试使用“get_dummies”进行一次性编码。但两列被视为不同的问题。 (第一个问题中的'2'和第二个问题中的'2'被视为不同的值)
有什么好的方案可以解决这个问题吗?
【问题讨论】:
标签: python pandas one-hot-encoding