【发布时间】:2017-09-05 00:23:28
【问题描述】:
我使用朴素贝叶斯分类器进行文本分类。如何使用互信息度量进行特征选择来提高算法的准确性?
【问题讨论】:
我使用朴素贝叶斯分类器进行文本分类。如何使用互信息度量进行特征选择来提高算法的准确性?
【问题讨论】:
您可以在文本分类中使用 2 项改进。首先,您使用您使用的预处理技术(例如 N-Gram)进行改进。其次,可以使用TF-IDF、互信息、卡方等特征选择技术,也可以使用遗传算法、蝙蝠算法、ABC-Colony、蚁群等其他优化算法。 TF-IDF 在信息检索中非常流行。朴素贝叶斯对特征选择方法非常敏感,因此可以结合预处理技术、特征选择方法和分类方法来优化分类结果。
【讨论】: