【发布时间】:2021-02-05 14:07:27
【问题描述】:
我在使用此数据框时遇到了一些问题,其中必须将具有相同名称的列缩减为至少一个“1”作为“1”的值。
+---+---+---+---+---+---+---+---+---+
| a | a | a | b | c | c | c | d | d |
+---+---+---+---+---+---+---+---+---+
| 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 |
| 0 | 0 | 0 | 1 | 0 | 1 | 1 | 1 | 0 |
| 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 |
+---+---+---+---+---+---+---+---+---+
对于这样的事情,对大型数据集的每一列使用“或”条件可能是一项耗时的任务,所以我很难弄清楚。我用了 max(axis=1, level=0) 还是不行。
我想要的输出:
+---+---+---+---+
| a | b | c | d |
+---+---+---+---+
| 1 | 1 | 1 | 1 |
| 0 | 1 | 1 | 1 |
| 1 | 0 | 1 | 0 |
+---+---+---+---+
【问题讨论】:
标签: python pandas numpy dataframe data-manipulation