【问题标题】:Entropy in classification分类中的熵
【发布时间】:2017-12-04 15:52:34
【问题描述】:

我只是对熵有几个疑问。熵公式为 -summation(p(i|j) log2 p(i|j) 这是只有 2 个值的目标属性的公式。如果目标有超过 2 个等级值(比如高、中和低)怎么办?公式将如何受到影响? 那将会, -求和(p(i|j)log3 p(i|j))?

另一个问题: 如何计算没有任何偏差的随机基线分类器的准确性? 说我的问题是:

 1)class1=50% and class2=50%
 2)class1=40% and class2=60%
 3)class1=10%,class2=20% and class3=70%

你能帮我解决这两个问题吗?

【问题讨论】:

    标签: machine-learning classification


    【解决方案1】:

    不,对数的通常选择仍然以 2 为底,“位”。

    但实际上,对数的基数只是一个常数,在大多数情况下会抵消掉或者是一个无关紧要的全局缩放常数。

    【讨论】:

    • 谢谢。您能否也告诉基线准确性的答案?
    • 那部分无法回答,不完整。
    • 这其实是我面试时问的一个问题。我无法弄清楚答案,因为他们给出的结果是公正的。
    • 在采访中,您可以要求澄清。我看到了一种获得简单答案的方法,可能是他们正在寻找的。但是您需要以交互方式检查“没有任何偏见”的含义。这甚至可能是测试的一部分!
    猜你喜欢
    • 2020-01-03
    • 2013-12-25
    • 2021-07-17
    • 2019-07-13
    • 2021-03-19
    • 2011-09-30
    • 2018-08-03
    • 2021-04-21
    • 2018-12-23
    相关资源
    最近更新 更多