【问题标题】:Cluster analysis algorithm for identifying line clusters on a map用于识别地图上的线簇的聚类分析算法
【发布时间】:2019-04-13 23:23:32
【问题描述】:

我有一组相当大的 (r,g,b) 色数据点,其 (x,y) 坐标如下所示:

在将它们提交到我的数据库之前,我想自动识别所有点簇(其中大部分看起来像线)并根据它们所属的簇为每个彩色点分配一个类别。

根据scikit-learn roadmap,我应该使用 Meanshift 或 Gaussian 混合模型,但我想知道是否有任何可用的解决方案也考虑到共享相似颜色的附近点更有可能属于同一个集群。

我可以使用 GPU,因此欢迎任何类型的解决方案,即使它基于深度学习。


我尝试了@mcdowella 的答案,效果出奇的好。我使用 HDBSCAN Robust Single Linkage 实现在这些点的高维版本(通过 T-SNE 生成)上运行它,它在没有任何参数调整的情况下逼近了许多线。

【问题讨论】:

  • 我认为这里不适合提出这类问题。也许统计堆栈交换会更合适?
  • 我投票结束这个问题,因为它应该在数据科学/统计/机器学习堆栈交换上

标签: python algorithm machine-learning scikit-learn deep-learning


【解决方案1】:

我会尝试https://en.wikipedia.org/wiki/Single-linkage_clustering - 它倾向于遵循线条,有时对于想要漂亮紧凑的圆形簇并获得散落的意大利面条的人来说甚至是不利的(https://www.stat.cmu.edu/~cshalizi/350/lectures/08/lecture-08.pdf P7 上的漂亮图片)。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-01-31
    • 2018-09-08
    • 1970-01-01
    • 2010-09-09
    • 2012-03-30
    • 2010-11-28
    • 2011-09-20
    相关资源
    最近更新 更多