java - k-means 聚类答案

【问题标题】：java - k-means clusteringjava - k-means 聚类
【发布时间】：2018-01-14 17:08:11
【问题描述】：

我有以下输入整数向量（示例）：

4 138 233 461 610 621 669 742 814 827
89 138 334 656 697 810
138
138 196 738
659 738
4 461
138 337 756 810
8 138 196 337 468 663 664 756 809 810

它们都包含整数值 [1-850]，并且都存储在 csv 文件中。

我想根据向量中的相似性将它们分成多个集群，但我对如何在 java 中为我的输入数据准确地实现 k-means 算法感到困惑。有人愿意提供提示或代码方面的帮助吗？

提前致谢。

【问题讨论】：

如果您确实有代码，我们可以为您提供帮助。但我们不会为您编写代码。
您有什么具体问题吗？对于 SO 来说，帮助的范围太广了。
Ehm，无法使用搜索引擎？
嗨，很抱歉没有发布代码，但我只是在学习，我什至不知道如何从 k-means 算法的代码开始，因为我不是即使确定这是否适合我的情况。我不希望任何人为我做这项工作，但如果我以正确的方式前进，任何提示将不胜感激。谢谢。
用伪代码看k-means，然后用Java写

【解决方案1】：

k-means 聚类的伪代码

假设您有一个度量（我们称之为 M），它可以比较输入对象（在您的情况下为向量）并输出相似性度量。

还有一个函数（我们称之为 A），它能够计算输入对象集合的平均值

【讨论】：