【发布时间】:2021-01-04 22:05:22
【问题描述】:
所以我从可汗学院了解了信息熵的概念,其中的表述形式为“每个符号需要的是或否问题的平均数量”。他们还使用对数给出了另一种形式。
假设我们有一个生成 A、B 和 C 的符号生成器。 P(A)=1/2, P(B)=1/3, P(C)=1/6 根据他们的方法,我会得到一个这样的图表: First method
然后我会将它们发生的概率乘以每次给予所需的问题数量 (1/2)*1+(1/3)*2+(1/6)*2 = 1.5bits
但是他们的其他方法给出了 -(1/2)log2(1/2)-(1/3)log2(1/3)-(1/6)log2(1/6)= 1.459...位
差异很小,但仍然很重要。我用不同的组合和概率尝试了这个,得到了相似的结果。有什么我想念的吗?我是否使用了错误的任何一种方法,还是其中一种更有条件?
【问题讨论】: