【发布时间】:2018-04-08 10:17:39
【问题描述】:
我正在尝试从带有日期的 GPS 高程位移散点图中过滤掉一些异常值
我正在尝试使用 df.rolling 计算每个窗口的中值和标准偏差,然后如果它大于 3 个标准偏差,则删除该点。
但是,我想不出一种方法来遍历列并比较滚动计算的中值。
这是我目前的代码
import pandas as pd
import numpy as np
def median_filter(df, window):
cnt = 0
median = df['b'].rolling(window).median()
std = df['b'].rolling(window).std()
for row in df.b:
#compare each value to its median
df = pd.DataFrame(np.random.randint(0,100,size=(100,2)), columns = ['a', 'b'])
median_filter(df, 10)
我如何循环遍历并比较每个点并将其删除?
【问题讨论】:
标签: pandas median outliers rolling-computation