【发布时间】:2017-06-06 00:04:01
【问题描述】:
我想对具有多个类(最多 10 个)的数据集进行聚类。但是这个聚类问题与通常的聚类不同。我需要聚类不同的类(如图所示;https://ibb.co/iiNbqv)而不是相同/相似的类。我应该使用哪种方法?你会推荐什么?
问题如下; 我有几个帧/图像(最多 10 个),每帧都有数十万次检测。因此,由于我正在处理的数据是检测的位置(x 和 y 坐标)。我要做的是,在这些帧中以一定的距离阈值重叠了多少检测。约束是,每一个帧的检测不应该在同一个重叠的簇中超过一次,如图所示。所以基本上,我应该从其他帧中找到最近的点检测,并将它们放在同一个集群中。但是一旦我这样做了,集群中的每个点之间的距离都不应该超过远距离阈值
干杯
【问题讨论】:
-
为什么有些聚类只有两个点,尽管第三类附近有一个点?推动这种集群的基本原理是什么?
-
实际上,每个类都是不同的图像帧,每个点都是图像中的检测位置。所以当我按顺序做时,结果如图所示。但可以肯定的是,左上角的点应该在紧密的簇中。此外,如果没有来自其他类的附近(高于阈值)点,则可能存在一些具有两个点的集群。
-
这个还没有明确说明。什么定义了算法的“完整”聚类(可接受的解决方案)?什么定义了最佳解决方案?您为此开发了哪些算法?数据如何表示(程序输入是什么)?
-
抱歉给您带来不便,我在上面的问题中添加了更多细节。我使用了具有联合概率的树结构。与多假设跟踪类似的方法。它可以很好地找到最近的点,但问题是它没有考虑从第一帧到最后一帧之间的距离。
标签: machine-learning computer-vision associations cluster-analysis