【发布时间】:2017-04-05 14:34:38
【问题描述】:
我可以在 rapidminer 中使用 k-means 对包含 8000 个图像标签的 8000 个文本文件进行聚类吗?如果可能的话,应该选择什么合适的 K 和最大运行?
【问题讨论】:
标签: k-means rapidminer
我可以在 rapidminer 中使用 k-means 对包含 8000 个图像标签的 8000 个文本文件进行聚类吗?如果可能的话,应该选择什么合适的 K 和最大运行?
【问题讨论】:
标签: k-means rapidminer
是的,RapidMiner 中有一个 k-Means 运算符,甚至还有一些额外的变体,例如带有内核的 k-Means 和 X-means。 要处理文本文件,您可以使用 RapidMiner 市场上提供的文本处理扩展。
最佳参数设置当然取决于您的数据,但您可以尝试不同的设置。一种方法是将 k-means 算子放在“优化参数”中,可以使用集群性能算子之一或自定义性能度量来评估性能。
【讨论】: