如何根据属性子集（4 个属性）对数据进行聚类？答案

【问题标题】：How to cluster data based on a subset of attributes (4 attributes)?如何根据属性子集（4 个属性）对数据进行聚类？
【发布时间】：2019-08-12 08:42:24
【问题描述】：

我有一个pandas DataFrame，它保存一些对象的数据，其中对象的某些部分的位置（左、上、右、下）。

例如：

ObjectID    Left, Right, Top, Bottom
1            0      0     0      0
2            20    15     5      5
3            3      2     0      0

如何根据这 4 个属性对对象进行聚类？有没有推荐给我的聚类算法/技术？

【问题讨论】：

【解决方案1】：

几乎所有的聚类算法都是多变量的，可以在这里使用。所以你的问题太笼统了。

可能值得先查看适当的距离度量。

任何建议都是合理的，因为我们不知道您的数据是如何分布的。

【讨论】：

【解决方案2】：

根据数据类型和最终目标，您可以尝试 k-means、k-modes 或 k-prototypes。如果您的数据混合了分类或连续变量，那么您可以尝试partition around medoids 算法。但是，正如之前另一位用户所说，您能否提供有关数据类型及其差异的更多信息。

【讨论】：