【发布时间】:2017-03-17 12:36:24
【问题描述】:
我的树形图只显示了两个叶子:“DIFF”和“REG”,完全忽略了响应变量的其他值。为什么树忽略其他 6 个值?这是否与它们仅代表我的响应变量中总值的一小部分这一事实有关?下表按响应变量中的值显示频率计数
35785 ED 1%
38060 NONE 1%
45880 INC 1%
49787 UT 1%
53108 OR 1%
165945 ET 4%
1728019 DIFF 43%
1894532 REG 47%
【问题讨论】:
-
更改抽样以增加其他响应变量的比例。此外,在不了解您的预测变量关于您的预测变量的分布的情况下 - 很难做出任何推断。您最好将此问题发布到 CrossValidated,因为这里没有编程示例。
标签: r tree classification