【发布时间】:2017-10-05 10:43:07
【问题描述】:
我无法让 Pandas 的 rolling 函数完成我想做的事情。我想为每个 frow 计算迄今为止该组内的最大值。这是一个例子:
df = pd.DataFrame([[1,3], [1,6], [1,3], [2,2], [2,1]], columns=['id', 'value'])
看起来像
id value
0 1 3
1 1 6
2 1 3
3 2 2
4 2 1
现在我希望获得以下DataFrame:
id value
0 1 3
1 1 6
2 1 6
3 2 2
4 2 2
问题是当我这样做时
df.groupby('id')['value'].rolling(1).max()
我得到了相同的 DataFrame。当我这样做时
df.groupby('id')['value'].rolling(3).max()
我得到一个带有 Nans 的 DataFrame。有人可以解释如何正确使用rolling 或其他一些 Pandas 函数来获取我想要的 DataFrame 吗?
【问题讨论】:
-
如果你想要在精神上与
rolling相似的东西,你可以像这样使用expanding:df.groupby('id').expanding().max()。但是,做一些快速测试这比其他两个答案慢。只是 FWIW,尽管它可能很有用,因为expanding确实为您提供了超过cummax的其他选项,如果您需要它们(例如窗口大小等)
标签: python python-3.x pandas dataframe group-by