【问题标题】:Clustering with N nodes and K distribution centers具有 N 个节点和 K 个分发中心的集群
【发布时间】:2017-12-01 03:04:02
【问题描述】:

我有一个包含N 节点K 配送中心数据集。如果我知道他们各自的 (x,y) 坐标

我可以使用什么算法来集群这些节点以保持平衡 在距离节点中心和分配给节点的数量之间 中心?

例如,我可以使用作为标准,将节点分配到它们最近的分布中心,但这可能会产生具有许多节点的分布中心,我想避免这种情况。有什么帮助吗?

【问题讨论】:

  • 可以写成 MIP(混合整数规划问题)。类似于分配问题,
  • 节点分布良好与靠近其“仓库”有多重要?考虑一个人为的例子,有 2 个仓库,N-1 个节点靠近仓库 A,只有 1 个节点靠近 B。我们什么时候将节点连接到 B?
  • 你说得对,Erwin,这是第一种技术并且效果很好,但我正在尝试牺牲最佳答案的更快方法,因此,MIP 不再是我的选择。感谢您的建议
  • 这就是拉里的重点,我正在寻找最佳答案的近似值。很高兴看到解决这种情况的不同方法是如何工作的,因为这是一个极端情况。有时它会更喜欢最小距离而不是天平。如果在您的情况下,算法将 N-1 个节点匹配到 A 并且只有一个到 B 对我来说是好的,或者如果它试图平衡一些节点也是好的。假设我正在搜索接近我的中心的 K 均值。提前致谢。
  • 您必须先定义“平衡”的含义,然后才能提出实现它的算法。您必须决定与每个配送中心的节点数量大致相等相比,节点的重要接近程度有多少。也许您想要调整它的能力,以便您可以设置相对重要性并使算法尽可能接近。但是没有更详细的要求,很难给你一个有意义的答案。

标签: algorithm optimization cluster-analysis load-balancing heuristics


【解决方案1】:

将此公式化为优化问题。

例如平均距离,以及当太多 N 分配给同一个 K 时的惩罚因子。

然后使用标准优化技术来寻找解决方案。

不要指望开箱即用的东西可以支持像您这样的模糊约束。您必须决定什么是好的解决方案,然后让优化器搜索好的解决方案。

【讨论】:

    猜你喜欢
    • 2016-06-26
    • 2012-02-06
    • 1970-01-01
    • 2019-09-28
    • 2021-10-16
    • 1970-01-01
    • 2022-11-03
    • 1970-01-01
    相关资源
    最近更新 更多