【发布时间】:2016-04-09 18:03:20
【问题描述】:
我有一组位置(索引),在这些位置(索引)可以在数据集中找到局部最大值。我已经应用了以下简单的极值检测方法,但是由于我的数据对较小的波动很敏感,我希望过滤检测到的极值以仅包括离平均值一个标准偏差的异常值,如在 21 分钟的滑动窗口中测量的那样到活动量。
为此,我需要滚动计算每个 21 分钟窗口的平均值和标准差,这需要pandas.rolling_mean 方法。然而,在将detected_extremanp.array 传递给rolling_mean 和stddev 方法时,我得到了结果:[[ nan nan nan nan nan nan …]] 不可用的结果。这是为什么呢?
x = np.array(df_1, dtype=np.float)
# for local maxima
positions = argrelextrema(x, np.greater)
detected_extrema = x.take(positions)
print detected_extrema
print pd.rolling_mean(detected_extrema, 21, min_periods=None, freq=None, center=False, how=None)
print pd.rolling_std(detected_extrema, 21, min_periods=None, freq=None, center=False, how=None)
输出:
[[ 89. 60. 78. 55. 61. 49. 38. 40. 30. 20.
36. 39. 22. 19. 772. 204. 153. 139. 184. 130.
154. 187. 174. 279. 273. 164. 42. 36. 1004. 216.
761. 322. 205. 564. 373. 171.]]
[[ nan nan nan nan nan nan nan nan nan nan nan nan nan nan
nan nan nan nan nan nan nan nan nan nan nan nan nan nan
nan nan nan nan nan nan nan nan]]
[[ nan nan nan nan nan nan nan nan nan nan nan nan nan nan
nan nan nan nan nan nan nan nan nan nan nan nan nan nan
nan nan nan nan nan nan nan nan]]
【问题讨论】:
-
你的输入数据中有
nans吗?
标签: python numpy pandas nan mean