【发布时间】:2021-10-02 13:40:09
【问题描述】:
我目前有一个多元回归,它根据预期寿命和影响它的变量生成 OLS 汇总,但不包括 RMSE 或标准偏差。 statsmodels 是否有 rsme 库,有没有办法计算我的代码的标准差?
我找到了这个问题的前一个例子:regression model statsmodel python,我阅读了 statsmodels 信息页面:https://www.statsmodels.org/stable/generated/statsmodels.tools.eval_measures.rmse.html 和测试我仍然无法解决这个问题。
import pandas as pd
import openpyxl
import statsmodels.formula.api as smf
import statsmodels.formula.api as ols
df = pd.read_excel(C:/Users/File1.xlsx, sheet_name = 'States')
dfME = df[(df[State] == "Maine")]
pd.set_option('display.max_columns', None)
dfME.head()
model = smf.ols(Life Expectancy ~ Race + Age + Weight + C(Pets), data = dfME)
modelfit = model.fit()
modelfit.summary
【问题讨论】:
-
对于 rmse,您可以在我的回答中使用另一个
statsmodels函数。你想计算什么标准差? -
我正在寻找每个州的预期寿命并查看我的代码,我已将其过滤到缅因州。我将做所有 50 个州,我需要找到每个州的标准偏差。对于我的分析来说,了解哪些状态与平均值的偏差较小和较大是很重要的。
-
那么预期寿命的标准差?
标签: python pandas regression statsmodels standard-deviation