【发布时间】:2015-08-12 15:04:33
【问题描述】:
我编写了一个函数来计算向量的熵,其中每个元素代表一个类的元素数。
function x = Entropy(a)
t = sum(a);
t = repmat(t, [1, size(a, 2)]);
x = sum(-a./t .* log2(a./t));
end
例如:a = [4 0],然后是entropy = -(0/4)*log2(0/4) - (4/4)*log2(4/4)
但是对于上述函数,由于log2(0),所以当拆分为纯时熵为NaN,如上例所示。纯分裂的熵应该为零。
由于数据非常大,我应该如何解决对性能影响最小的问题?谢谢
【问题讨论】:
标签: matlab decision-tree entropy