【发布时间】:2015-11-03 19:41:00
【问题描述】:
我正在研究一个理解朴素贝叶斯分类的示例,并想知道我的思维过程是否正确。所以我有三个用户,如果他们拥有耐克或锐步鞋,或两者兼而有之,那么他们是真还是假。所以用户可以拥有不止一双鞋。如果他们拥有耐克,我想计算锐步的概率。这是我的数据:
User | Nike | Reebok
Jesse | true | false
Jake | false | true
John | true | true - only user with both
这是我尝试这样做的方法:
1) P(both | Reebok) = 1/2 = 50%
2) Prior Prob = P(both | total user = 1/3 = 33%
3) P(Reebok | total user = 2/3 = 67%
4) Posterior Prob = (50% * 33%)/67% = 25%
因此结果是,如果用户拥有 Nike,他们拥有 Reebok 的后验概率为 25%。
【问题讨论】:
-
我不明白你复杂的计算,但你显然 P(both/just Reebok) 应该是 0,因为如果你只有“reebok”,你可以拥有“both”。如果你的意思是 P(both | reebok),那么这是 50%,P(both | nike) 也是一样,所以你直接得到你的答案。
-
@Holt - 抱歉假设用户可以拥有不止一双鞋。
-
我投票结束这个问题作为题外话,因为这是一个数学问题。在 math.stackexchange.com 上会更合适
标签: algorithm machine-learning classification