【问题标题】:How to add features in lingpipe classifier?如何在 lingpipe 分类器中添加特征?
【发布时间】:2014-06-30 02:17:46
【问题描述】:

现在我只是在数据集上训练 DynamicLMClassifier 并将我的文本分类。如何添加一个特征,以便分类器赋予某些词更多的权重,例如,如果这句话包含“专业”,它很可能属于 A 类? 或者如何根据段落而不是 ngram 进行分类?

我注意到有一个特征提取器,但它似乎不接受参数。

【问题讨论】:

    标签: java machine-learning lingpipe


    【解决方案1】:

    我会这样做作为评论,但我还没有特权。

    DynamicLMClassifier 不允许使用任意功能。一个是我们的 LogisticRegression 分类器,但它使用起来更复杂。一个很好的起点是教程:

    http://alias-i.com/lingpipe/demos/tutorial/logistic-regression/read-me.html

    关于如何根据段落而不是 ngram 进行分类的第二个问题有点不清楚。将整个段落用作单个特征可能会创建非常稀疏的数据。

    布雷克

    【讨论】:

    • 链接到非现场资源的答案不是很好,因为如果链接断开,它们就会断开...如果您可以在答案中包含一些信息会更好。如果您只是推荐一个教程,那么这可能更适合作为评论。
    猜你喜欢
    • 2020-11-29
    • 1970-01-01
    • 2020-11-21
    • 1970-01-01
    • 2023-01-15
    • 2019-06-30
    • 2013-04-23
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多