降低错误率剪枝算法 Reduce Error Pruning
首先说明:剪枝大体上分为预剪枝和后剪枝。
预剪枝是指在生成树的过程中,先判断生成子树会不会有性能提升,如果有就生成,没有就剪枝。
后剪枝是指在生成树后,判断树的枝干在剪和不剪的情况下有没有性能提升再决定剪不剪枝。
降低错误率剪枝算法属于后剪枝算法,即当树生成后,将子树替换成其叶节点,类别按叶节点中样本最多的类,然后判断剪和不剪之间的性能差异,然后再决定剪不剪枝。
考察结点⑤,若将其领衔的子树替换为叶结点,则替换后的叶结点包含编号为 {6,7,15},对应的结果为{好瓜,好瓜,坏瓜} 的训练样例,则叶结点类别标记为"好瓜’,此时决策树验证集精度仍为57.1%. 于是,可以不进行剪枝.
各位看官老爷,一键三连再走吧~再不济点个赞也行啊~~