【发布时间】:2014-04-22 00:28:53
【问题描述】:
我想执行决策树分析。我希望决策树使用模型中的所有变量。
我还需要绘制决策树。我怎样才能在 R 中做到这一点?
这是我的数据集的样本
> head(d)
TargetGroup2000 TargetGroup2012 SmokingGroup_Kai PA_Score wheeze3 asthma3 tres3
1 2 2 4 2 0 0 0
2 2 2 4 3 1 0 0
3 2 2 5 1 0 0 0
4 2 2 4 2 1 0 0
5 2 3 3 1 0 0 0
6 2 3 3 2 0 0 0
>
我想用公式
myFormula <- wheeze3 ~ TargetGroup2000 + TargetGroup2012 + SmokingGroup_Kai + PA_Score
请注意,所有变量都是分类变量。
编辑:
我的问题是一些变量没有出现在最终的决策树中。
树的深度应该由惩罚参数 alpha 定义。我不知道如何设置这个惩罚,以便所有变量都出现在我的模型中。
换句话说,我想要一个最小化训练误差的模型。
【问题讨论】:
-
我尝试了各种建议的库,但我没有找到如何强制树使用所有变量
-
@Donbeo,你得到答案了吗,还是还在犹豫?
-
我没有。我目前不再感兴趣,但答案可能对社区有用
标签: r decision-tree