考虑到彼此的距离将节点放置在圆上的算法答案

【问题标题】：Algorithm for placing nodes on a circle considering their distance to eachother考虑到彼此的距离将节点放置在圆上的算法
【发布时间】：2019-04-17 21:48:44
【问题描述】：

我有以下问题。我有大脑区域和它们之间的相关性。我知道距离的大脑区域。现在，我们预计相关性与大脑区域之间的距离呈负相关。因此，当我们增加距离时，相关性会下降到零。期望是 1/D^2。

我想可视化我的相关矩阵以检查异常情况。我已经有一些其他的实现，比如Taiyun's correlation matrix visualization 和一个简单的 2D 散点图，其中 1/D^2 曲线为蓝线。

接下来我想要基于correlation circles的东西。

我为其创建了 Node 类的大脑区域。所以我的大脑区域是节点。我模仿与边缘的相关性。我的边缘有一个源节点和一个目标节点，还有一个相关性和距离，所以我可以将它们耦合到正确的节点。查找表需要距离和相关性（回耦合到 regionID 和 regionName 等）。

现在我想要的是将所有节点放在一个圆圈上，以便彼此距离小的节点靠近放置，而远离彼此的节点放置得更远。这样，坚固的边缘（很厚）彼此靠近。当你有一个非常强大的边缘穿过圆圈时，它会很尴尬并且眼睛很容易发现它。 我当然会寻求最佳解决方案，正如下面所指出的，不存在一个真正的答案。

我一直在搜索谷歌，但由于我不知道要搜索什么，所以没有找到任何结果。我怀疑有一个标准算法的名称，但我不知道。这种算法的链接也可以。

到目前为止，我想出的办法是以所有距离的总和最小的方式排列圆上的节点。但是为此，我需要建立一种点系统，以便彼此靠近并彼此靠近的区域得到例如一些+点和彼此靠近但彼此远离的点会得到一些下降点。现在优化点算法并获得最高结果。

关于这个问题的任何提示？我的数学不是那么好;)。我目前正在谷歌上搜索圆圈、节点、权重..

注意

如果您有任何其他好的想法来可视化矩阵，请务必私信我，或在此处发表评论:)。

【问题讨论】：

所以您正在寻找一种方法来轻松发现相关性与预期相差甚远 (1/d^2) 的节点？或者您是否正在寻找这种情况更常见的大脑区域？还是单图？
确实在寻找相关性远远超出预期的可视化（通过散点图 + 2D 1/D^2 曲线轻松完成，曲线上方的所有内容 = 有趣）。尽可能多地测试你能想到的选项永远不会有坏处。您可能会看到其他可视化的有趣事物。其背后的基本原因确实很简单。根据规则 r = 1/D^2 发现相关性异常。除此之外，其他可视化可能会在一般图片中提供洞察力。因此，将可视化相互比较可能会提供洞察力，忘记 1/d^2 规则。

标签： algorithm

【解决方案1】：

您描述的一般问题没有解决方案，因为您正在尝试制作从 2D 表面到保留所有距离的 1D 线的地图，这是不可能的。如果您想将某个特定区域与所有其他区域进行比较，则可以将所有其他区域围成一个圆圈，使它们的距离与该区域的距离相匹配（但是这些其他区域之间的距离会失真）。

但是在近似距离方面，您当然可以做得比随机的更好。这是一种方法：第一步是进行多次随机排列，然后从中挑选出最好的。下一个改进将是针对某些成本函数优化这些安排中的每一个，方法是通过小步移动区域直到它们达到局部最小值，然后选择这些局部最小值中的最佳值。其结果如下图所示，Python 代码进一步向下。

import pylab as px
import numpy as nx
import numpy.random as rand
rand.seed(1)
rt2 = nx.sqrt(2)

N = 10 # number of brain regions

# make brain region locations r=1
regions = []
s = 2.
while len(regions)<N:
    p = 2*s*rand.rand(2)-s
    if nx.sqrt(px.dot(p,p))<s:
        regions.append(p)
regions = nx.array(regions)

#px.figure()
px.subplot(2,2,1)
for i in range(len(regions)):
    px.text(regions[i,0], regions[i,1], `i`, fontsize=15)
px.xlim(-1.1*s, 1.1*s)
px.ylim(-1.1*s, 1.1*s)
px.title("inital positions")

# precalc distance matrix for future comparisons
dm = nx.zeros((N,N), dtype=nx.float)
for i in range(N):
    for j in range(N):
        dm[i,j] = nx.sqrt(nx.sum((regions[i,:]-regions[j,:])**2))

def randomize_on_circle(n):
    """return array of n random angles"""
    return 2*nx.pi*rand.rand(n)

def cost_fcn(d_target, d_actual): # cost for distances not matching
    return abs(d_target-d_actual)

def calc_cost(angles):
    """calc cost for the given arrangement    """
    c = 0.
    for i in range(N-1):
        for j in range(i, N):
            # sqrt(...) is distance between two pts on a circle (I think)
            c += cost_fcn(dm[j, i], rt2*nx.sqrt(1-nx.cos(angles[i]-angles[j])))
    return c

def optimize_step(a, shift=2*nx.pi/360):
    """try shifting all points a bit cw and ccw, and return the most beneficial"""
    max_benefit, ref_cost = None, None
    best_i, best_shift = None, None
    for imove in range(N): # loop through the regions and try moving each one
        cost0 = calc_cost(a)
        for da in (shift, -shift):
            a_temp = nx.array(a)
            a_temp[imove] += da
            cost = calc_cost(a_temp)
            benefit = cost0 - cost  # benefit if moving lowers the cost
            if max_benefit is None or benefit > max_benefit:
                max_benefit, best_i, best_shift, ref_cost = benefit, imove, da, cost
    return max_benefit, best_i, best_shift, ref_cost       

lowest_cost, best_angles = None, None
cost_initials, cost_plateaus = [], []
for i in range(30):  # loop though 20 randomized placements on the circle
    angles = randomize_on_circle(N)
    costs = []
    benefits = []
    # optimize each original arrangement by shifting placements one-by-one in small steps
    count_benefits_neg = 0
    count_total, max_total = 0, 2000
    while count_benefits_neg < 10: # better to do a variable step size
        b, i, s, c = optimize_step(angles)
        angles[i] += s
        costs.append(c)
        benefits.append(b)
        if b < 0:
            count_benefits_neg += 1
        count_total += 1
        if count_total > max_total:
            print count_total, b, costs[-20:], benefits[-20]
            raise "not finding an equilibrium"
    if lowest_cost is None or c < lowest_cost:
        lowest_cost = c
        best_angles = nx.array(angles)
        cost_graph = costs[:]
        benefit_graph = nx.array(benefits)
    cost_plateaus.append(c)
    cost_initials.append(costs[0])

px.subplot(2, 2, 2)
px.plot(cost_graph, 'o') # make sure the cost is leveling off
px.title("cost evoloution of best")
px.subplot(2, 2, 3)
px.plot(cost_initials, 'o')
px.plot(cost_plateaus, 'd')
px.title("initial and final costs")

px.subplot(2, 2, 4)
for i in range(len(best_angles)):
    px.text(nx.cos(best_angles[i]), nx.sin(best_angles[i]), `i`, fontsize=15)
px.xlim(-1.2, 1.2)
px.ylim(-1.2, 1.2)
px.title("positioned on circle")

px.show()

有趣的是，这似乎导致了远的事情是远的，近的事情是近的，但是中档的订单搞砸了，所以也许这会做你想要的？（这也说明了从 2D 到 1D 的基本问题。例如，在圆上，4 想要离 9 更远，但是如果不靠近其他数字，它就无法做到这一点，而在 2D 中它可以走到一边。）

您可能需要修改cost_fnc，它指定了圆上点的距离与二维排列的距离不匹配的惩罚。改变这一点以增加大错误的成本（比如二次方），或者强调大距离正确的成本，比如d_target*(abs(d_actual-d_target))等，可能会有所帮助。

此外，相对于 2D 数据的大小更改圆的大小会大大改变它的外观，您可能希望圆比数据小一些，就像我在这里所做的那样，这将更多地分散在圆圈周围的点。（这里的圆圈 R = 1，所以只需适当地缩放数据。）还要注意，这将使成本的定量评估不是很有意义，因为最好的安排永远不会得到非常低的成本，因为某些地区永远不可能与 2D 数据中的距离一样远。

运行多个随机开始的关键在于，不断演变的排列可能会陷入局部最小值。这种技术似乎很有用：解决有助于使距离正确并降低成本（图#3，蓝点=初始随机，菱形=局部最小值）并且它比其他方法更能帮助一些初始安排，所以尝试一下很好多个初始安排。此外，由于其中一些似乎稳定在 15 左右，这让人相信这种安排可能具有代表性。

【讨论】：

为此我寻求一个最优解，它确实有一个解决方案。我寻求一个答案，尽可能多地正确放置，而有些则没有。
我完全同意可视化的重要性。但在我看来，所需的近似值似乎超出了您可以期望其他人提供的值，因为只有您可以选择哪些方式来扭曲和撕裂空间以保持对您重要的东西的一致性（从数学上讲，距离不能是其中之一事物）。我建议，如果您以更开放的方式（如您的最后一句话）重新表述问题，而不是要求不可能的映射，请寻求可能向您展示您想知道的内容的可视化建议，您可能会更幸运。
不，我定义。想要这个选项，因为这是我现在的想法:)。这是可能的，但也许我的解释是不正确的。如果完全随机是最佳的最佳选择，我确实寻求最佳选择。但首先我想寻找一个更好的位置。我认为至少有可能在圆上将实际距离上的大多数点靠近在一起。
哇，感谢您将这些细节拼凑在一起。我会定义的。我在家的时候测试一下。在我完成最终例程之前，我不会将其标记为答案（所以如果它表现更好，我可以发布我自己的），但会给予学分:)。
没问题...我试图解释如何做到这一点，然后它似乎更容易做到。（虽然这肯定不是我在 SO 上获得的最简单的 20 分，但显然这不是重点。这只是一个有趣的问题。）

【解决方案2】：

我建议您使用energy minimization 算法将节点放置在圆上，以最小化正方形（圆上的距离 - 大脑中的距离）之类的东西。然后按照你的描述加厚边缘，可视化应该是完整的。

【讨论】：

【解决方案3】：

GraphViz 可能有一些算法链接。或者，您可以将数据转换为 GraphViz 接受的格式并通过该格式运行。

【讨论】：

起初我想把它放在我的应用程序中，而不使用 GraphViz。但感谢您的提示。除了一本书的链接之外，找不到任何真正有趣的东西。