【发布时间】:2014-03-10 14:31:03
【问题描述】:
我计算了一天中用户可能出现的状态(H:=Home、w:=Work 或 E:=Elsewhere)的熵级别。假设用户 A 一天中每个小时的可能状态为 {H,H,H,H,H,H,H,H,H,W,W,W,W,W,W,W,W, W,E,E,H,H,H,H}
P(H)=13/24=0.54
P(W)=9/24=0.38
P(E)=2/24=0.08
使用香农熵,我想计算用户的熵水平,以了解用户的可预测性。
H(A)=(-P(H)*log2(H)) + (-P(W)*log2(W)) + (-P(E)*log2(E))
=0.48 + 0.53 + 0.29
=1.3
如何区分这些以比特为单位的信息是低熵还是高熵?
【问题讨论】:
标签: math machine-learning artificial-intelligence entropy