【发布时间】:2017-07-18 08:53:36
【问题描述】:
这个问题可能很明显或已经问过,但我找不到解决方案:
我想创建一个包含所有可能组合(和变量数量)的数据框,使其看起来像以下示例:
dataframe <- data.frame(variable = 1:4,
a = c("gender", NA, NA, NA),
b = c("age", NA, NA, NA),
c = c("city", NA, NA, NA),
d = c("education", NA, NA, NA),
e = c("gender", "age", NA, NA),
f = c("gender", "city", NA, NA),
g = c("gender", "education", NA, NA),
h = c("age", "city", NA, NA),
i = c("age", "education", NA, NA),
j = c("city", "education", NA, NA),
k = c("gender", "age", "city", NA),
l = c("gender", "age", "education", NA),
m = c("gender", "city", "education", NA),
n = c("gender", "age", "city", "education"))
我有太多变量,所以不值得写出来,我想避免错误。感谢您的帮助!
【问题讨论】:
-
你能显示用于创建这个的输入数据吗
-
输入数据可能是任何数据框的 15 个列名。或者只是
variables = c("gender", "age", "city", "education", "school", "income", "bmi", "SES", "..."),或者你需要什么输入数据?计算出来的数据框当然必须有与变量一样多的行。 -
当心组合爆炸。使用 15 个变量,您可以获得 2 ^ 15 列
-
您的用例是什么?如果它尝试不同的模型,还有更好的选择:Lasso、Ridge、stepwise 等等
-
@Aurèle 好点。我想根据推理查看多元回归的不同组合,而不使用模型选择函数。我只是想看看可能的组合来尝试不同的回归模型。
标签: r variables dataframe combinations