【问题标题】:Fiting a sum of 2D gaussians to 2d data in python?在python中将二维高斯总和拟合到二维数据?
【发布时间】:2015-07-21 06:17:01
【问题描述】:

我有一些 2D 数据,特别是扫描的 X 光胶片。这些具有重叠点源曝光的测量值。数据示例:http://i.stack.imgur.com/oawlU.png

我想通过将二维高斯总和拟合到数据中来找到峰值位置。我尝试了其他几种方法并取得了一些成功,包括定位全局最大值、拟合高斯并减去它的“星搜索”方法。循环它可以很好地找到所有峰值,但它不稳定且不是很准确。我想使用星搜索输出作为适合的第一个猜测,但我遇到了麻烦,实现scipy.optimize.curve_fit

我创建了一个函数twoD_envelope,它创建了从星搜索中找到的所有高斯的二维包络。这会产生以下输出:http://i.stack.imgur.com/4KnpG.png

我的印象是我可以在curve_fit 中使用它作为初步猜测,但是我得到以下TypeError

TypeError: twoD_envelope() takes 4 positional arguments but 358802 were given

358802 比数据大小多 1,这是一个巨大的线索,但我无法弄清楚问题所在!我是一位具有“实用”编码知识的物理学家,因此非常感谢任何输入。

代码如下。

def twoD_envelope(npoints, xls, yls, pars):

    envl = copy.copy(sq_image)
    envl[:] = 0


    for n in range(0,npoints):
        height, cx, cy, width_x, width_y = pars[n]
        FWHM = 0.5*(width_x+width_y)
        g=makeGaussian(shape(sq_image)[0],fwhm=FWHM,center=[cx+xls[n],cy+yls[n]])
        envl = envl + g

    return envl.ravel()

# Create x and y indices
x = np.linspace(0, np.size(sq_image[0]), np.size(sq_image[0])+1)
y = np.linspace(0, np.size(sq_image[1]), np.size(sq_image[1])+1)
x, y = np.meshgrid(x, y)
coords = [x,y]

data = sq_image

initial_guess = twoD_envelope(9,xls,yls,pars)

pars_opt, pars_cov = opt.curve_fit(twoD_envelope, coords, data, p0=initial_guess)

sq_image 是数据,ndarray 形状为(599,599)

(pars, xls, yxl = 来自星搜索的高斯拟合参数列表)

makeGaussian 是在别处定义的函数)

【问题讨论】:

    标签: python scipy


    【解决方案1】:

    我认为您的错误消息是您传递给curve_fit 的函数的结果,它看起来不像是正确的形式。这可能会导致data 数组被解释为vars,从而导致您看到TypeError(如果无法运行代码,很难判断)。根据文档,传递给curve_fit的函数应该,

    将自变量作为第一个参数,将要拟合的参数作为单独的剩余参数。

    您可能还需要在 initial_guess 之前使用星号将其作为元组传递,例如

    pars_opt, pars_cov = opt.curve_fit(twoD_envelope, coords, data, p0=*initial_guess)

    要拟合单个 2D 高斯,其中 p0 将是大约 7 个参数,有一个非常好的答案可能会有所帮助:Fitting a 2D Gaussian function using scipy.optimize.curve_fit - ValueError and minpack.error

    您的问题的一个可能解决方案可能是遍历您的 2D sq_image 并在本地使用单个 2D 高斯拟合以及来自星星搜索的每个初始参数...

    编辑:适合高斯的代码。

    import scipy.optimize as opt
    import numpy as np
    import pylab as plt
    import matplotlib.cm as cm
    import Image
    
    
    def twoD_Gaussian((x, y), amplitude, xo, yo, sigma_x, sigma_y, theta):
        xo = float(xo)
        yo = float(yo)    
        a = (np.cos(theta)**2)/(2*sigma_x**2) + (np.sin(theta)**2)/(2*sigma_y**2)
        b = -(np.sin(2*theta))/(4*sigma_x**2) + (np.sin(2*theta))/(4*sigma_y**2)
        c = (np.sin(theta)**2)/(2*sigma_x**2) + (np.cos(theta)**2)/(2*sigma_y**2)
        g = amplitude*np.exp( - (a*((x-xo)**2) + 2*b*(x-xo)*(y-yo) 
                                + c*((y-yo)**2)))
        return g.ravel()
    
    
    # Create x and y indices
    I = Image.open('./30155885.png')
    p = np.asarray(I).astype('float')
    w,h = I.size
    x, y = np.mgrid[0:h, 0:w]
    
    #Use only one channel of image
    p = p[:,:,0]
    
    #Fit 2D Gaussian
    initial_guess = (3,10,10,20,40,0)
    popt, pcov = opt.curve_fit(twoD_Gaussian, (x, y), p.ravel(), p0=initial_guess)
    data_fitted = twoD_Gaussian((x, y), *popt)
    
    
    fig, ax = plt.subplots(1, 1)
    cb = ax.imshow(p, cmap=plt.cm.jet, origin='bottom',
        extent=(x.min(), x.max(), y.min(), y.max()))
    ax.contour(x, y, data_fitted.reshape(x.shape[0], y.shape[1]), 8, colors='w')
    
    
    plt.colorbar(cb)
    plt.show()
    

    图像 30155885 在哪里,

    请注意,仅使用了一个通道的图像数据(您应该将数据数组替换为来自 sq_image 的那个)。这导致,

    【讨论】:

    • 谢谢 Ed,这很有帮助。我将不得不重新考虑代码,但恐怕我不明白你关于变量太多的观点。 358802 号是 sq_image.ravel()。如果 curve_fit 不能处理,那么它也不能适合单个高斯?参数个数应该是每个峰的4个高斯参数,即9个峰总共36个变量。我喜欢你关于迭代拟合单峰的建议,但我认为这就是 curve_fit 所尝试的?
    • 是的,抱歉,深夜,所以我对拟合问题和错误中的数字有点困惑(我虽然您计划将具有相似数量系数的高斯总和拟合到点)。我已经编辑了我的答案以显示适合单个 2D 高斯。然后,您可以尝试将其细化为高斯之和等。
    猜你喜欢
    • 2015-04-05
    • 2019-02-08
    • 1970-01-01
    • 1970-01-01
    • 2020-10-31
    • 2016-04-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多