【发布时间】:2014-09-05 21:33:46
【问题描述】:
使用以下代码对地理位置坐标进行聚类会产生 3 个聚类:
import numpy as np
import matplotlib.pyplot as plt
from scipy.cluster.vq import kmeans2, whiten
coordinates= np.array([
[lat, long],
[lat, long],
...
[lat, long]
])
x, y = kmeans2(whiten(coordinates), 3, iter = 20)
plt.scatter(coordinates[:,0], coordinates[:,1], c=y);
plt.show()
使用 Kmeans 进行位置聚类是否正确,因为它使用 Euclidean distance 而不是 Haversine formula 作为距离函数?
【问题讨论】:
标签: python numpy geolocation scipy k-means