【发布时间】:2019-10-09 20:45:31
【问题描述】:
所以我试图通过将我的行设为学生姓名、列设为所有可用课程(HUDK4050 等)来整理数据集。但是,似乎我需要为每门独特的课程创建一个新专栏。这样做的最佳方法是什么?我已经通过更正间距和大小写问题等整理了一些代码。
StudentName Class1 Class2 Class3 Class4 Class5 Class6
<chr> <chr> <chr> <chr> <chr> <chr> <chr>
1 Student1 ITSF4090 ITSF5008 ITSF5035 HUDK4050 NA NA
2 Student2 HUDK4050 QMSS5010 QMSS5015 QMSS5072 STAT4205 QMSS5021
3 Student3 HUDK4050 ITSF4090 ITSF4025 ITSF5035 NA NA
4 Student4 HUDK4050 HUDK4029 HUDK4052 CCPJ5062 A&HA4063 NA
5 Student5 HUDK4050 HUDK4052 HUDK4029 NA NA NA
6 Student6 HUDK4050 HUDM4125 HUDM5026 HUDM5126 NA NA
类似的东西
StudentName HUDK4050 HUDK4029 Class3 Class4 Class5 Class6
<chr> <chr> <chr> <chr> <chr> <chr> <chr>
1 Student1 1 1
2 Student2 1 0
3 Student3 1 0
4 Student4 0 1
5 Student5 1 1
6 Student6 1 1
【问题讨论】:
-
这些是众所周知的转换,称为 melt、cast、reshape。您想使用列
Class1,...,6的值作为列名。有很多重复。 -
@smci 我实际上尝试查找重复项,因为我知道我已经看到了“将所有列转换为长,但首先,然后使用新的第二列转换为宽”的特定序列之前至少两次,但找不到一个。如果您知道这样的副本,我认为最好将其链接起来,这样我们就可以获得这些副本的规范副本。