【发布时间】:2017-12-01 03:04:02
【问题描述】:
我有一个包含N 节点 和K 配送中心 的数据集。如果我知道他们各自的 (x,y) 坐标
我可以使用什么算法来集群这些节点以保持平衡 在距离节点中心和分配给节点的数量之间 中心?
例如,我可以使用作为标准,将节点分配到它们最近的分布中心,但这可能会产生具有许多节点的分布中心,我想避免这种情况。有什么帮助吗?
【问题讨论】:
-
可以写成 MIP(混合整数规划问题)。类似于分配问题,
-
节点分布良好与靠近其“仓库”有多重要?考虑一个人为的例子,有 2 个仓库,N-1 个节点靠近仓库 A,只有 1 个节点靠近 B。我们什么时候将节点连接到 B?
-
你说得对,Erwin,这是第一种技术并且效果很好,但我正在尝试牺牲最佳答案的更快方法,因此,MIP 不再是我的选择。感谢您的建议
-
这就是拉里的重点,我正在寻找最佳答案的近似值。很高兴看到解决这种情况的不同方法是如何工作的,因为这是一个极端情况。有时它会更喜欢最小距离而不是天平。如果在您的情况下,算法将 N-1 个节点匹配到 A 并且只有一个到 B 对我来说是好的,或者如果它试图平衡一些节点也是好的。假设我正在搜索接近我的中心的 K 均值。提前致谢。
-
您必须先定义“平衡”的含义,然后才能提出实现它的算法。您必须决定与每个配送中心的节点数量大致相等相比,节点的重要接近程度有多少。也许您想要调整它的能力,以便您可以设置相对重要性并使算法尽可能接近。但是没有更详细的要求,很难给你一个有意义的答案。
标签: algorithm optimization cluster-analysis load-balancing heuristics