【发布时间】:2013-07-21 06:08:51
【问题描述】:
我正在尝试根据拍摄地点和拍摄时间对照片进行聚类。我的聚类算法要求我定义每两点之间的距离函数,(在本例中,每两张图片。)
对于时间参数的良好转换有什么想法吗?我曾考虑使用欧几里得距离作为纬度/经度,但我不知道时间参数需要哪种转换才能计算受时间影响的距离。
【问题讨论】:
标签: cluster-analysis euclidean-distance
我正在尝试根据拍摄地点和拍摄时间对照片进行聚类。我的聚类算法要求我定义每两点之间的距离函数,(在本例中,每两张图片。)
对于时间参数的良好转换有什么想法吗?我曾考虑使用欧几里得距离作为纬度/经度,但我不知道时间参数需要哪种转换才能计算受时间影响的距离。
【问题讨论】:
标签: cluster-analysis euclidean-distance
尝试使用例如星展扫描。如果您查看通用版本 (GDBSCAN),很明显您还可以在同一时间。
这是通用 DBSCAN 框架内 DBSCAN 的直接扩展。
使用索引来加速你的算法会有点棘手,但 ELKI 应该足够灵活以允许这样的扩展并且非常快。
关于纬度/经度,不要在经纬度上使用欧几里得距离。如果您首先将数据投影到本地坐标系中,例如单个 UTM 区域,则可以(如果您的数据跨越全球,这将不起作用)。但是使用大圆近似值之一。 ELKI 已经为此提供了索引支持,您应该能够轻松添加时间组件(特别是,因为您只需要阈值)。
【讨论】: