【发布时间】:2018-06-15 16:06:03
【问题描述】:
我有一个这样的数据框:
A B C
1 10 121
5 6 122
7 8 123
9 10 124
12 23 125
10 24 1500
13 36 1600
通过对列 C 应用 mean+/- 2std.deviation 方法,我希望从 C 中删除异常值并过滤我最终期望得到的数据帧
A B C
1 10 121
5 6 122
7 8 123
9 10 124
12 23 125
这是我的代码:
target=df['C']
mean = target.mean()
sd = target.std()
lower_boundary = [x for x in target if (x < mean - 2 * sd)]
upper_boundary= [x for x in target if (x > mean - 2 * sd)]
selected_df=df[(target==lower_boundary) & (target==upper_boundary)]
selected_df
但它显示
TypeError: invalid type comparison
错误。你能告诉我我哪里出错了吗?
【问题讨论】:
标签: python dataframe outliers standard-deviation