【问题标题】:Naive Bayes Classifier朴素贝叶斯分类器
【发布时间】:2017-01-10 17:37:42
【问题描述】:

所以我正在构建一个自动语音识别系统,我想使用 贝叶斯定理 作为分类器。 我仍在阅读它并试图理解它的概念,所以尽量以最简单的方式回答我。

我使用MFCC从我的演讲中提取特征并创建了我的Class_template,这是一个包含行作为单词特征的数组,列代表每个单词(我只使用了十个单词词汇,所以十列是十个单词)。 现在我有了我的一系列特征,我输入了一个新的测试词;对其进行处理并将其转换为特征向量,一切都很好。

我想使用贝叶斯定理来确定我的class_template 中我的新测试词属于哪个类(词)。

所以我开始计算每个单词(我的测试单词和类)的平均值和标准差,现在我认为我应该将这些值插入 PDF(概率密度函数),并使用它来计算我的测试词对我的class_template 中每个词的概率,最高概率。我猜是正确的答案。

1-那么我做错了什么,我正朝着正确的方向前进???

2-任何提示、指示或做什么???

3-当我计算 PDF 时,我应该插入哪个意思和标准,是类的还是我的测试词?

谢谢。

【问题讨论】:

    标签: matlab classification signal-processing speech-recognition naivebayes


    【解决方案1】:

    到目前为止,您所描述的大部分是正确的,但是模式类的先验概率如何?如果你假设它是一个均匀分布,那么它与 MLE 相同,并且在小样本上会表现不佳。

    【讨论】:

    • 对不起,我没听懂你在说什么?什么是 MLE??
    • 最大似然估计
    • 我认为你正在做孤立的单词识别,你应该插入该类的 mean 和 var,由相同单词的一些样本组成。
    • 是的,这正是我正在为孤立词做 ASR,我只是不知道下一步是什么???
    • 你应该假设单词(模式类)的先验概率,就像 P(word1)=0.02, P(word2)=0.02,那么你可以计算 P(word-n|test word) =P(word-n)*P(test word|word-n),通过比较P(word-n|test word),可以判断出test word是哪个词。先验概率是你应该做的假设。
    猜你喜欢
    • 2015-08-27
    • 2018-02-06
    • 2012-07-02
    • 2018-07-17
    • 2015-06-25
    • 2014-09-18
    • 2012-02-11
    • 2011-03-05
    相关资源
    最近更新 更多