【发布时间】:2013-03-21 18:01:39
【问题描述】:
我正在训练 mahout 分类器。我是否需要对我的训练数据进行词干提取、小写和停用词删除,否则 mahout 会在训练过程中处理这些问题。下面的命令我用于培训。
$MAHOUT_HOME/bin/mahout trainclassifier -i category-training-data -o category-bayes-model -type bayes -ng 1 -source hdfs
【问题讨论】: