【发布时间】:2014-04-09 16:26:52
【问题描述】:
我正在尝试使用 statsmodels 和 pandas 数据框运行多重 OLS 回归。不同行的不同列中缺少值,并且我不断收到错误消息: ValueError:数组不能包含 infs 或 NaNs 我看到了这个类似的问题,但并没有完全回答我的问题:statsmodel.api.Logit: valueerror array must not contain infs or nans
我想做的是运行回归并忽略我在此回归中使用的变量缺少变量的所有行。现在我有:
import pandas as pd
import numpy as np
import statsmodels.formula.api as sm
df = pd.read_csv('cl_030314.csv')
results = sm.ols(formula = "da ~ cfo + rm_proxy + cpi + year", data=df).fit()
我想要像缺失 =“drop”这样的东西。 任何建议将不胜感激。非常感谢。
【问题讨论】:
标签: python regression statsmodels