【发布时间】:2015-12-31 15:41:45
【问题描述】:
我正在尝试了解滚动统计信息。我创建了一个数据框:
d = date_range('1/1/2011', periods=72, freq='H')
s = Series(randn(len(rng)), index=rng)
作为:
import numpy as np
from numpy.random import randn
import time
r = date_range('1/1/2011', periods=72, freq='H')
r
len(r)
[r[i] for i in range(len(r))]
s = Series(randn(len(r)), index=r)
s
s.plot()
df_new = DataFrame(data = s, columns=['Random Number Generated'])
df_new.diff().hist()
现在我试图在 DataFrame 的新列中找到过去 3 小时内该系列的滚动平均值。我试图先找到滚动平均值:
df_new['mean'] = rolling_mean(df_new, window=3)
我说的对吗?但结果看起来并不平均。有人可以解释一下吗?
【问题讨论】:
-
你的意思是“结果看起来不像意思”?你能说得具体点吗?
-
我的前 3 列有 NaN
标签: python numpy pandas dataframe