【问题标题】:ID3 implementation using gain ratio使用增益比的 ID3 实现
【发布时间】:2015-02-25 20:32:42
【问题描述】:

我已经实现了 ID3(使用信息增益来选择最佳属性),它工作正常。但是,现在我正在尝试其他启发式方法,例如增益比。增益比计算正确,但是当我使用增益比的值来拆分树时,它确实变得奇怪而复杂。
是不是一定要对增益比值做点什么,还是像使用信息增益一样直接使用(即选择增益比最大的属性)?

【问题讨论】:

  • 谢谢,但没有完全回答我的问题:(

标签: java decision-tree id3


【解决方案1】:

首先,请注意GR = IG/IV(其中GRgain ratioIG 是信息增益,IV 是信息价值(也就是内在价值)),所以如果IV = 0,@987654329 @ 未定义。这种情况的一个例子是所有训练示例的属性值都相同。

现在,Quinlan 在Induction of decision trees 中定义了GR,以抵消IG 对具有多个值的属性的偏见。不过他也指出GR可能会偏向IV非常小的属性。
为了克服这种偏见,Quinlan 指出,在选择增益率最高的属性时,应该只考虑 IG 平均或更好的属性。

如果我理解正确,只考虑具有平均或更好IG 的属性有助于抵消对具有非常小的IV 属性的偏见,因为IG <= IV。 (有关更多信息,请参阅here。)

也许这会改善您的结果。

【讨论】:

    猜你喜欢
    • 2012-10-24
    • 1970-01-01
    • 2011-01-13
    • 1970-01-01
    • 2018-09-07
    • 2013-10-17
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多