【发布时间】:2013-07-18 10:10:02
【问题描述】:
我正在研究 C# 的朴素贝叶斯解决方案,其中有两种可能的结果。我找到了一个小示例代码,但想知道是否有人能够解释最后一行。
分析器正在寻找一个词属于两个类别之一的概率
cat1count 是在类别 1 中找到的单词数(如果在类别 1 中找到 2 次,则为 2 / 在类别 1 中的总字数)
cat1total = 类别 1 的总字数
据我了解,bw 是该词属于第 1 类的概率,gw 是该词属于第 2 类的概率
pw 和 fw 是我开始迷失的地方。完整的源代码可以在here找到。
float bw = cat1count / cat1total;
float gw = cat2count / cat2total;
float pw = ((bw) / ((bw) + (gw)));
float
s = 1f,
x = .5f,
n = cat1count + cat2count;
float fw = ((s * x) + (n * pw)) / (s + n);
fw 是什么?我知道bw、gw 和pw 是什么。
【问题讨论】:
-
bw、fw、pw 是存储 cat1count、cat1total 值的变量,您可能想发布您的源代码,这样会更有帮助吗?
-
不是答案,但如果除法
cat1count / cat1total是两个int的商,这应该给出非整数float结果。 -
如果您了解
bw、gw、pw是什么,请您分享一下您的理解,这样我们就不必自己解决了? -
抱歉,我不能提供更多相关信息。
-
分析器正在寻找一个词属于两个类别的 1 的概率 cat1count 是在类别 1 中找到的词的数量(如果该词在类别 1 中被找到 2 次,则为 2 / 总词在第 1 类中) cat1total = 据我了解的第 1 类中的单词总数,bw 是该单词属于第 1 类的概率,gw 是该单词属于第 2 类的概率 pw 和 fw 是我开始了解的地方丢失完整的源代码可以在这里找到github.com/joelmartinez/nBayes/blob/master/nBayes/Analyzer.cs
标签: c# math machine-learning probability