【问题标题】:Centroid algorithm for text classification, tools?文本分类的质心算法,工具?
【发布时间】:2012-05-26 16:34:23
【问题描述】:

正如here 所讨论的那样,你知道有什么工具可以为java 中的文本分类提供质心算法吗?

【问题讨论】:

    标签: java algorithm machine-learning document-classification centroid


    【解决方案1】:

    scikit-learn 将此作为类 NearestCentroid 包含在内。它还包括 L2-normalized tf-idf 的实现。

    [免责声明:我是 scikit-learn 开发人员。]

    【讨论】:

    • 谢谢,但是你对 Java 有什么了解吗?
    • @user601:不,抱歉。不过,实现起来并不难。
    • 嗨,假设我的训练实例是 [1,5,1,0],[0,1,3,2];那么质心将是 [1,6,4,2]/2 = [0.5,3,2,1] 对吗?
    • 如果这些是特定类的仅有的两个样本并且您使用的是欧几里得距离,那么可以。
    • 这不只是平均值吗?在构建质心时,欧几里得距离如何涉及?
    猜你喜欢
    • 2012-08-02
    • 2011-08-02
    • 2011-04-22
    • 2018-05-29
    • 2011-04-04
    • 2013-04-23
    • 2015-06-04
    • 1970-01-01
    相关资源
    最近更新 更多