【发布时间】:2017-08-17 04:23:14
【问题描述】:
给定一个二分类问题:
有四个正面例子和五个负面例子。因此, P(+) = 4/9 和 P(-) = 5/9。训练样例的熵为 −4/9 log2(4/9) − 5/9 log2(5/9) = 0.9911。
对于a3,这是一个连续的属性,我想求出每次分割的信息增益。
所以我按升序对 a3 值进行排序并找到它们的拆分点。但是我该如何计算它们的熵呢?
给出的答案是:
上图中的信息增益列仅为 0.9911 - 熵。
但是我如何找到熵?
熵的公式是:
但我不明白如何使用这个公式来找到分裂点的熵。
【问题讨论】:
-
我认为这个问题与 Cross Validated (stats.stackexchange.com) 更相关。
标签: machine-learning classification decision-tree entropy