【发布时间】:2013-02-12 05:29:25
【问题描述】:
4我目前正在尝试将大量数据拟合到正弦函数中。在我只有一组数据(一维数组)的情况下,scipy.optimize.curve_fit() 工作正常。但是,据我所知,如果函数本身只是一维的,则它不允许更高维的数据输入。我不想使用 for 循环遍历数组,因为这在 python 中运行速度非常慢。
到目前为止,我的代码应该类似于:
from scipy import optimize
import numpy as np
def f(x,p1,p2,p3,p4): return p1 + p2*np.sin(2*np.pi*p3*x + p4) #fit function
def fit(data,guess):
n = data.shape[0]
leng = np.arange(n)
param, pcov = optimize.curve_fit(f,leng,data,guess)
return param, pcov
其中 data 是一个三维数组 (shape=(x,y,z)),我想将每一行 data[:,a,b] 拟合到函数中,param 是一个 (4,y,z) 形状的数组作为输出。
当然,对于多维数据,这会导致
ValueError: operands could not be broadcast together with shapes (2100,2100) (5)
也许有一个简单的解决方案,但我不知道该怎么做。有什么建议吗?
搜索我的问题的答案非常困难,因为使用这些关键字的大多数主题都与高维函数的拟合有关。
【问题讨论】:
-
不要担心 for 循环很小。无论如何,我很确定curve_fitting 将是您代码中较慢的部分。如果您怀疑循环是瓶颈,请分析代码!
-
嗯,这个想法是如果曲线拟合可以使用整个数组而不是运行函数 y*z 次,它会更快。这就是我说 for 循环很慢时的意思。
-
或许你可以通过FFT得到sin的参数。
-
为什么曲线拟合应该快得多?大部分时间可能会花在拟合例程上,而不是循环数据上。
-
我预计它会更快,因为这是我在比较 for 循环方法以遍历数据数组与直接将整个数组输入函数时使用其他例程所经历的(最多一个因素100)。我承认这些是相当简单的计算,也许使用像 curve_fit 这样更耗时的方法节省的时间可能不那么重要,但我仍然希望这个过程能稍微加速。我也尝试过使用 FFT,但由于我的采样点很少,结果不太令人满意。