【问题标题】:How to use hmmlearn to classify English text?如何使用hmmlearn对英文文本进行分类?
【发布时间】:2017-04-03 07:32:52
【问题描述】:

我想实现一个经典的马尔可夫模型问题:训练 MM 学习英文文本模式,并用它来检测英文文本与随机字符串。

我决定使用hmmlearn,这样我就不必自己编写了。但是我对如何训练它感到困惑。貌似对HMM中的组件数量有要求,但是英文的合理数量是多少呢?另外,我可以不做一个简单的高阶马尔可夫模型而不是隐藏吗?大概有趣的属性是 ngram 的模式,而不是隐藏状态。

【问题讨论】:

    标签: python-3.x text-classification markov-models hmmlearn


    【解决方案1】:

    hmmlearn 专为 HMM 的无监督学习而设计,而您的问题显然是有监督的:给定英语和随机字符串的示例,学习区分两者。此外,正如您正确指出的那样,隐藏状态的概念很难为文本数据定义,因此对于您的问题,纯 MM 会更合适。我认为您应该能够在 Python 中用

    【讨论】:

      猜你喜欢
      • 2017-08-08
      • 2015-03-16
      • 2018-11-07
      • 2013-02-10
      • 2017-04-11
      • 2013-05-17
      • 2017-07-29
      • 1970-01-01
      • 2011-09-04
      相关资源
      最近更新 更多