【问题标题】:can I use k-means in rapidminer?我可以在 rapidminer 中使用 k-means 吗?
【发布时间】:2017-04-05 14:34:38
【问题描述】:

我可以在 rapidminer 中使用 k-means 对包含 8000 个图像标签的 8000 个文本文件进行聚类吗?如果可能的话,应该选择什么合适的 K 和最大运行?

【问题讨论】:

    标签: k-means rapidminer


    【解决方案1】:

    是的,RapidMiner 中有一个 k-Means 运算符,甚至还有一些额外的变体,例如带有内核的 k-Means 和 X-means。 要处理文本文件,您可以使用 RapidMiner 市场上提供的文本处理扩展。

    最佳参数设置当然取决于您的数据,但您可以尝试不同的设置。一种方法是将 k-means 算子放在“优化参数”中,可以使用集群性能算子之一或自定义性能度量来评估性能。

    【讨论】:

    • 感谢您的帮助...我可以使用任何运算符仅保留英文单词并删除任何其他语言的任何单词吗???
    • 到目前为止,我自己还没有这样做过。可能很棘手,因为在词干之后可能是相似的。你可以试试 RapidMiner Marketplace 中的Aylien Text Analysis Extension,它支持语言检测-
    猜你喜欢
    • 1970-01-01
    • 2011-09-11
    • 2011-06-10
    • 2013-11-23
    • 1970-01-01
    • 2017-05-24
    • 2014-04-13
    • 2017-12-31
    • 2021-05-20
    相关资源
    最近更新 更多