【发布时间】:2014-09-11 04:08:42
【问题描述】:
我正在运行如下回归(df 是 pandas 数据框):
import statsmodels.api as sm
est = sm.OLS(df['p'], df[['e', 'varA', 'meanM', 'varM', 'covAM']]).fit()
est.summary()
这给了我一个0.942 的 R 平方。所以我想绘制原始的y-values 和拟合值。为此,我对原始值进行了排序:
orig = df['p'].values
fitted = est.fittedvalues.values
args = np.argsort(orig)
import matplotlib.pyplot as plt
plt.plot(orig[args], 'bo')
plt.plot(orig[args]-resid[args], 'ro')
plt.show()
然而,这给了我一个图表,其中的值完全偏离了。没有什么可以暗示0.9 的 R 平方。因此,我尝试自己手动计算:
yBar = df['p'].mean()
SSTot = df['p'].apply(lambda x: (x-yBar)**2).sum()
SSReg = ((est.fittedvalues - yBar)**2).sum()
1 - SSReg/SSTot
Out[79]: 0.2618159806908984
我做错了吗?或者我的计算与 statsmodels 的结果相差甚远是有原因的吗? SSTot、SSReg 的值为 48084、35495。
【问题讨论】:
标签: python numpy statsmodels