【发布时间】:2019-04-13 23:23:32
【问题描述】:
我有一组相当大的 (r,g,b) 色数据点,其 (x,y) 坐标如下所示:
在将它们提交到我的数据库之前,我想自动识别所有点簇(其中大部分看起来像线)并根据它们所属的簇为每个彩色点分配一个类别。
根据scikit-learn roadmap,我应该使用 Meanshift 或 Gaussian 混合模型,但我想知道是否有任何可用的解决方案也考虑到共享相似颜色的附近点更有可能属于同一个集群。
我可以使用 GPU,因此欢迎任何类型的解决方案,即使它基于深度学习。
我尝试了@mcdowella 的答案,效果出奇的好。我使用 HDBSCAN Robust Single Linkage 实现在这些点的高维版本(通过 T-SNE 生成)上运行它,它在没有任何参数调整的情况下逼近了许多线。
【问题讨论】:
-
我认为这里不适合提出这类问题。也许统计堆栈交换会更合适?
-
我投票结束这个问题,因为它应该在数据科学/统计/机器学习堆栈交换上
标签: python algorithm machine-learning scikit-learn deep-learning