【发布时间】:2015-12-07 23:52:54
【问题描述】:
我按月对产品运行 OLS。虽然这适用于单个产品,但我的数据框包含许多产品。如果我创建一个 groupby 对象,OLS 会报错。
linear_regression_df:
product_desc period_num TOTALS
0 product_a 1 53
3 product_a 2 52
6 product_a 3 50
1 product_b 1 44
4 product_b 2 43
7 product_b 3 41
2 product_c 1 36
5 product_c 2 35
8 product_c 3 34
from pandas import DataFrame, Series
import statsmodels.api as sm
linear_regression_grouped = linear_regression_df.groupby(['product_desc'])
X = linear_regression_grouped['period_num']
y = linear_regression_grouped['TOTALS']
model = sm.OLS(y, X)
results = model.fit()
我在 sm.OLS() 行收到此错误:
ValueError: unrecognized data structures: <class 'pandas.core.groupby.SeriesGroupBy'>
那么我怎样才能通过我的数据框并为每个 product_desc 应用 sm.OLS()?
【问题讨论】:
标签: python pandas statsmodels