【发布时间】:2013-06-10 21:04:00
【问题描述】:
令std::vector<int> counts 为正整数向量,令N:=counts[0]+...+counts[counts.length()-1] 为向量分量之和。设置pi:=counts[i]/N,我使用经典公式H=p0*log2(p0)+...+pn*log2(pn)计算熵。
counts 向量正在变化 --- 计数增加 --- 每 200 次变化我重新计算熵。经过快速的 google 和 stackoverflow 搜索后,我找不到任何增量熵计算的方法。那么问题来了:是否有增量方法like the ones for variance 用于熵计算?
编辑:这个问题的动机是在VFDT-like 学习者中使用此类公式进行增量信息增益估计。
已解决:见this mathoverflow post。
【问题讨论】:
-
您可能想尝试前往math.stackexchange 以获得对您问题的更详细的数学处理。
-
Shaktal,我在 mathoverflow 上发布了这个问题,他们在其中指出了以下论文:hal.inria.fr/docs/00/60/90/65/PDF/RR-7663.pdf
标签: c++ algorithm decision-tree entropy