【发布时间】:2020-09-04 14:01:11
【问题描述】:
我有一个 csv 文件,其中包含 name、sub_a、sub_b、sub_c、sub_d、segment 和 gender 列。我想创建一个新列classes,其中所有课程(sub-columns)用逗号分隔,每个学生都参加。
最简单的方法是什么?
结果数据框应如下所示:
+------+-------+-------+-------+-------+---------+--------+---------------------+
| name | sub_a | sub_b | sub_c | sub_d | segment | gender | classes |
+------+-------+-------+-------+-------+---------+--------+---------------------+
| john | 1 | 1 | 0 | 1 | 1 | 0 | sub_a, sub_b, sub_d |
+------+-------+-------+-------+-------+---------+--------+---------------------+
| mike | 1 | 0 | 1 | 1 | 0 | 0 | sub_a, sub_c, sub_d |
+------+-------+-------+-------+-------+---------+--------+---------------------+
| mary | 1 | 1 | 0 | 1 | 1 | 1 | sub_a, sub_b, sub_d |
+------+-------+-------+-------+-------+---------+--------+---------------------+
| fred | 1 | 0 | 1 | 0 | 0 | 0 | sub_a, sub_c |
+------+-------+-------+-------+-------+---------+--------+---------------------+
【问题讨论】:
-
你能把那个excel作为文本发布在这里吗?一揽子复制并粘贴,然后将其格式化为代码块
-
@Datanovice 我编辑了我的问题。
标签: python pandas data-manipulation