【问题标题】:Clustering origin/destination points聚类起点/终点
【发布时间】:2018-04-03 14:13:31
【问题描述】:

我有 1000 个地理点(纬度、经度)作为起点/终点。还有一个历史数据显示了一些 O-D 对之间的旅行成本。对于某些 O-D,数据集中没有记录,而有些则有多个成本不同的记录(例如,由于季节性)。

我想将这 1000 个点聚集到几个集群(例如 20 个)中,这不仅基于它们的位置(纬度、经度),而且还考虑了平均旅行成本和共享目的地点。

如果您对聚类这些数据有任何建议,请告诉我。

【问题讨论】:

  • 这是未指定的。将它们放入随机分区中。 (或正式确定质量目标)

标签: machine-learning classification cluster-analysis o-d-matrix


【解决方案1】:

您必须以某种方式处理缺失值 - 为它们分配一些给定的标签或取一些平均值/中值。然后你可以使用任何你想要的算法(不同类型的特征可以一起作为算法的输入)

如果数据的维度不多,并且您或多或少地知道可能有多少簇,k-means 算法应该可以很好地工作。

如果您想在 2d 和 3d 上可视化您的数据和集群,并且您将拥有更多特征,则必须应用降维(PCA、t-SNE)。

【讨论】:

    猜你喜欢
    • 2021-02-17
    • 2014-08-27
    • 1970-01-01
    • 2012-07-25
    • 1970-01-01
    • 2023-04-07
    • 2015-12-09
    • 2015-09-03
    • 1970-01-01
    相关资源
    最近更新 更多