【发布时间】:2018-07-17 13:22:21
【问题描述】:
我对使用tidyr、dplyr 等还是很陌生,而且我有一些数据我不知道如何在R 中整理。
变量在行和列中混合在一起,并且电子表格看起来像是被拆分的,因此顶行和底行有不同类型的信息。
它的简化版本如下。
您可以想象这是一个有 4 个问题的考试:
- 前几行提供了有关每个问题的一些信息
- 最后几行显示不同学生(由他们的
IDNum给出)的问题是正确的 (1) 还是错误的 (0)。
这是原始数据:
Question Q1 Q2 Q3 Q4
Topic English English Math Math
Subtopic Grammar Vocabulary Algebra Geometry
Difficulty 2 4 3 4
IDNum
512 1 1 1 0
102 0 1 0 1
321 1 1 1 1
246 1 1 0 1
248 1 0 1 0
136 1 1 1 1
290 0 1 1 1
753 1 0 0 0
752 1 0 1 1
我想整理一下这个数据集。它看起来像下面这样:
IDNum Question Topic Subtopic Difficulty Correct
512 Q1 English Grammar 2 1
512 Q2 English Vocabulary 4 1
512 Q3 Math Algebra 3 1
512 Q4 Math Geometry 4 0
102 Q1 English Grammar 2 0
102 Q2 English Vocabulary 4 1
102 Q3 Math Algebra 3 0
102 Q4 Math Geometry 4 1
321 Q1 English Grammar 2 1
321 Q2 English Vocabulary 4 1
321 Q3 Math Algebra 3 1
321 Q4 Math Geometry 4 1
等等。
谢谢!
【问题讨论】:
-
最好使用 dput() 共享数据。
-
如果您是从 excel 中读取的,请附上您用来读取它的代码