在python中将二维高斯总和拟合到二维数据？答案

【问题标题】：Fiting a sum of 2D gaussians to 2d data in python?在python中将二维高斯总和拟合到二维数据？
【发布时间】：2015-07-21 06:17:01
【问题描述】：

我有一些 2D 数据，特别是扫描的 X 光胶片。这些具有重叠点源曝光的测量值。数据示例：http://i.stack.imgur.com/oawlU.png

我想通过将二维高斯总和拟合到数据中来找到峰值位置。我尝试了其他几种方法并取得了一些成功，包括定位全局最大值、拟合高斯并减去它的“星搜索”方法。循环它可以很好地找到所有峰值，但它不稳定且不是很准确。我想使用星搜索输出作为适合的第一个猜测，但我遇到了麻烦，实现scipy.optimize.curve_fit。

我创建了一个函数twoD_envelope，它创建了从星搜索中找到的所有高斯的二维包络。这会产生以下输出：http://i.stack.imgur.com/4KnpG.png

我的印象是我可以在curve_fit 中使用它作为初步猜测，但是我得到以下TypeError：

TypeError: twoD_envelope() takes 4 positional arguments but 358802 were given

358802 比数据大小多 1，这是一个巨大的线索，但我无法弄清楚问题所在！我是一位具有“实用”编码知识的物理学家，因此非常感谢任何输入。

代码如下。

def twoD_envelope(npoints, xls, yls, pars):

    envl = copy.copy(sq_image)
    envl[:] = 0


    for n in range(0,npoints):
        height, cx, cy, width_x, width_y = pars[n]
        FWHM = 0.5*(width_x+width_y)
        g=makeGaussian(shape(sq_image)[0],fwhm=FWHM,center=[cx+xls[n],cy+yls[n]])
        envl = envl + g

    return envl.ravel()

# Create x and y indices
x = np.linspace(0, np.size(sq_image[0]), np.size(sq_image[0])+1)
y = np.linspace(0, np.size(sq_image[1]), np.size(sq_image[1])+1)
x, y = np.meshgrid(x, y)
coords = [x,y]

data = sq_image

initial_guess = twoD_envelope(9,xls,yls,pars)

pars_opt, pars_cov = opt.curve_fit(twoD_envelope, coords, data, p0=initial_guess)

（sq_image 是数据，ndarray 形状为(599,599)）

(pars, xls, yxl = 来自星搜索的高斯拟合参数列表)

（makeGaussian 是在别处定义的函数）

【问题讨论】：

标签： python scipy

【解决方案1】：

我认为您的错误消息是您传递给curve_fit 的函数的结果，它看起来不像是正确的形式。这可能会导致data 数组被解释为vars，从而导致您看到TypeError（如果无法运行代码，很难判断）。根据文档，传递给curve_fit的函数应该，

将自变量作为第一个参数，将要拟合的参数作为单独的剩余参数。

您可能还需要在 initial_guess 之前使用星号将其作为元组传递，例如

pars_opt, pars_cov = opt.curve_fit(twoD_envelope, coords, data, p0=*initial_guess)

要拟合单个 2D 高斯，其中 p0 将是大约 7 个参数，有一个非常好的答案可能会有所帮助：Fitting a 2D Gaussian function using scipy.optimize.curve_fit - ValueError and minpack.error。

您的问题的一个可能解决方案可能是遍历您的 2D sq_image 并在本地使用单个 2D 高斯拟合以及来自星星搜索的每个初始参数...

编辑：适合高斯的代码。

import scipy.optimize as opt
import numpy as np
import pylab as plt
import matplotlib.cm as cm
import Image


def twoD_Gaussian((x, y), amplitude, xo, yo, sigma_x, sigma_y, theta):
    xo = float(xo)
    yo = float(yo)    
    a = (np.cos(theta)**2)/(2*sigma_x**2) + (np.sin(theta)**2)/(2*sigma_y**2)
    b = -(np.sin(2*theta))/(4*sigma_x**2) + (np.sin(2*theta))/(4*sigma_y**2)
    c = (np.sin(theta)**2)/(2*sigma_x**2) + (np.cos(theta)**2)/(2*sigma_y**2)
    g = amplitude*np.exp( - (a*((x-xo)**2) + 2*b*(x-xo)*(y-yo) 
                            + c*((y-yo)**2)))
    return g.ravel()


# Create x and y indices
I = Image.open('./30155885.png')
p = np.asarray(I).astype('float')
w,h = I.size
x, y = np.mgrid[0:h, 0:w]

#Use only one channel of image
p = p[:,:,0]

#Fit 2D Gaussian
initial_guess = (3,10,10,20,40,0)
popt, pcov = opt.curve_fit(twoD_Gaussian, (x, y), p.ravel(), p0=initial_guess)
data_fitted = twoD_Gaussian((x, y), *popt)


fig, ax = plt.subplots(1, 1)
cb = ax.imshow(p, cmap=plt.cm.jet, origin='bottom',
    extent=(x.min(), x.max(), y.min(), y.max()))
ax.contour(x, y, data_fitted.reshape(x.shape[0], y.shape[1]), 8, colors='w')


plt.colorbar(cb)
plt.show()

图像 30155885 在哪里，

请注意，仅使用了一个通道的图像数据（您应该将数据数组替换为来自 sq_image 的那个）。这导致，

【讨论】：

谢谢 Ed，这很有帮助。我将不得不重新考虑代码，但恐怕我不明白你关于变量太多的观点。 358802 号是 sq_image.ravel()。如果 curve_fit 不能处理，那么它也不能适合单个高斯？参数个数应该是每个峰的4个高斯参数，即9个峰总共36个变量。我喜欢你关于迭代拟合单峰的建议，但我认为这就是 curve_fit 所尝试的？
是的，抱歉，深夜，所以我对拟合问题和错误中的数字有点困惑（我虽然您计划将具有相似数量系数的高斯总和拟合到点）。我已经编辑了我的答案以显示适合单个 2D 高斯。然后，您可以尝试将其细化为高斯之和等。