【问题标题】:How to cluster data based on a subset of attributes (4 attributes)?如何根据属性子集(4 个属性)对数据进行聚类?
【发布时间】:2019-08-12 08:42:24
【问题描述】:

我有一个pandas DataFrame,它保存一些对象的数据,其中对象的某些部分的位置(左、上、右、下)。

例如:

ObjectID    Left, Right, Top, Bottom
1            0      0     0      0
2            20    15     5      5
3            3      2     0      0

如何根据这 4 个属性对对象进行聚类? 有没有推荐给我的聚类算法/技术?

【问题讨论】:

    标签: python cluster-analysis data-mining data-analysis hierarchical-clustering


    【解决方案1】:

    几乎所有的聚类算法都是多变量的,可以在这里使用。所以你的问题太笼统了。

    可能值得先查看适当的距离度量。

    任何建议都是合理的,因为我们不知道您的数据是如何分布的。

    【讨论】:

      【解决方案2】:

      根据数据类型和最终目标,您可以尝试 k-means、k-modes 或 k-prototypes。如果您的数据混合了分类或连续变量,那么您可以尝试partition around medoids 算法。但是,正如之前另一位用户所说,您能否提供有关数据类型及其差异的更多信息。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2011-03-29
        • 2015-02-02
        • 1970-01-01
        • 1970-01-01
        • 2021-11-03
        • 1970-01-01
        • 1970-01-01
        • 2019-06-30
        相关资源
        最近更新 更多