【发布时间】:2021-01-22 07:03:15
【问题描述】:
df fruit year price vol signifiance
0 apple 2010 1 5
1 apple 2011 2 4
2 apple 2012 3 3
3 apple 2013 3 3
4 apple 2014 3 3
5 apple 2015 3 3 important
...
47 banana 2010 1 4
如果果年很重要,我想使用该重要果年前后 5 年的数据对价格进行回归。
例如对于苹果,从 2010 年到 2020 年的价格回归。
我试过了:
df = df.groupby('significance')
Y = df['price']
X = df['vol']
model = sm.OLS(Y,X)
【问题讨论】:
-
每个
fruit组总是只有一个或零个important? -
一个水果中可以有多个“重要”年份,但它们不会重叠。
-
每组是否连续几年?
-
有些水果的起始年份不同,但这是每个水果的年度数据
标签: python python-3.x pandas dataframe regression