【问题标题】:Stuck on Naive Bayes Classification坚持朴素贝叶斯分类
【发布时间】:2015-11-03 19:41:00
【问题描述】:

我正在研究一个理解朴素贝叶斯分类的示例,并想知道我的思维过程是否正确。所以我有三个用户,如果他们拥有耐克或锐步鞋,或两者兼而有之,那么他们是真还是假。所以用户可以拥有不止一双鞋。如果他们拥有耐克,我想计算锐步的概率。这是我的数据:

User  | Nike  | Reebok 
Jesse | true  | false
Jake  | false | true 
John  | true  | true   - only user with both

这是我尝试这样做的方法:

1) P(both | Reebok) = 1/2 = 50%  
2) Prior Prob = P(both | total user = 1/3 = 33%  
3) P(Reebok | total user = 2/3 = 67%
4) Posterior Prob = (50% * 33%)/67% = 25%

因此结果是,如果用户拥有 Nike,他们拥有 Reebok 的后验概率为 25%。

【问题讨论】:

  • 我不明白你复杂的计算,但你显然 P(both/just Reebok) 应该是 0,因为如果你只有“reebok”,你可以拥有“both”。如果你的意思是 P(both | reebok),那么这是 50%,P(both | nike) 也是一样,所以你直接得到你的答案。
  • @Holt - 抱歉假设用户可以拥有不止一双鞋。
  • 我投票结束这个问题作为题外话,因为这是一个数学问题。在 math.stackexchange.com 上会更合适

标签: algorithm machine-learning classification


【解决方案1】:

根据Bayes' theorem

p(Reebok | Nike) = p(Reebok) p(Nike | Reebok) / p(Nike)

在你的例子中:

  • p(Reebok) = 2/3
  • p(Nike) = 2/3
  • p(Nike | Reebok) = 1/2

所以,p(Reebok | Nike) = 1/2 的结果符合预期。

【讨论】:

  • 所以我计算了 25% 的概率,但根据你的回答是 50%。我需要改变我的逻辑。朴素贝叶斯会产生不同的答案吗?
  • @jKraut 不,没有其他答案。您没有自变量Both。你可以直接验证正确的结果是 50%:Jake 和 John 拥有 Nike,而他们中只有 50% 拥有 Reebok。
  • @jKraut 当p(Reebok | Nike) 不等于p(Nike | Reebok) 时,您可以玩更多有趣的案例,例如您可以添加仅拥有Reebok 的第四个用户
  • @Orest Hera - 谢谢澄清。那么将其称为贝叶斯分类器或朴素贝叶斯分类器是否正确?
  • @jKraut 不,这只是使用帮助器贝叶斯定理计算贝叶斯分类所需的条件概率的示例我>。在这里Naive Bayes classifier 你可以找到简单的 Gaussian naive Bayes 示例,用于连续数据及其在下面使用 heightSex 分类体重脚尺寸。实际上,当我们有许多不同的变量(输入参数)时,需要条件独立的朴素假设。
猜你喜欢
  • 2013-04-18
  • 2015-08-27
  • 2012-07-02
  • 2017-01-10
  • 2013-12-02
  • 2015-01-03
  • 2018-02-06
  • 2018-07-17
相关资源
最近更新 更多