【问题标题】:Clustering with varying dimensions具有不同维度的聚类
【发布时间】:2012-07-16 22:41:30
【问题描述】:

在我的聚类问题中,不仅点可以来去去去,特征也可以删除或添加。有没有针对我的问题的聚类算法。

具体来说,我正在寻找这类聚类算法的凝聚层次聚类版本。

【问题讨论】:

    标签: cluster-analysis hierarchical-clustering online-algorithm


    【解决方案1】:

    您可以使用层次聚类(除非它的扩展性非常差)或任何其他基于距离的聚类。只是 k-means 有点棘手,因为当值不存在时如何计算平均值?

    您只需要定义一个合适的距离函数 首先

    聚类通常基于相似性,因此:首先找出“相似”对您意味着什么。这是非常特定于数据集和用例的,尽管许多人可以使用某种距离函数。没有“一刀切”的解决方案。

    【讨论】:

    • 我的数据是二进制数据,假设我使用汉明距离。但这并没有让问题变得更简单
    猜你喜欢
    • 2017-05-28
    • 1970-01-01
    • 1970-01-01
    • 2017-05-29
    • 2018-03-25
    • 1970-01-01
    • 2022-11-09
    • 2020-02-13
    • 2017-08-19
    相关资源
    最近更新 更多