【发布时间】:2018-02-02 15:06:52
【问题描述】:
我有一个 data.frame 具有以下属性:
list1 <- c(145540,145560, 157247, 145566)
list2 <- c(166927, NA, NA, NA)
list3 <- c(145592, 145560, 145566, NA)
df <- data.frame(list1, list2, list3)
我想为每个包含的 id 生成一个虚拟变量。结果应该是这样的。
list, 145540, 145560, 145566,145592,157247,166927 (= all possible ids in the data)
list1, 1, 1, 1, 0, 1, 0
list2, 0, 0, 0, 0, 0, 1
list3, 0, 1, 1, 1, 0, 0
任何想法如何实现这一目标?谢谢!
【问题讨论】:
-
看
?sample()。 -
您需要虚拟变量或值?标题具有误导性。您需要对输出进行更多解释。 0 和 1 是随机的或者它们有一些条件
-
目标是创建一个 data.frame,如果列表中存在例如 145540,则出现值 1,否则为 0。这与随机抽样无关。
标签: r dataframe dummy-variable