【发布时间】:2020-11-20 10:08:52
【问题描述】:
我有一个 pandas 数据框,其中每一行都有一个 numpy 数组。它看起来像这样:
| Column 1 |
|----------------|
| [nan, 4, 5] |
| [3, 2, 6] |
| [3, 3, 4]. |
我正在尝试获取这些数组的平均值,使用:
Avg = df['Column1'].mean()
尽管“.mean()”默认会跳过 nan,但这里并非如此。由于该行实际上不是空的,并且数组中只有一个值丢失,因此我得到以下结果:
print(Avg)
> [nan, 3, 5]
如何忽略第一行的缺失值? 理想情况下,这就是我想要实现的目标:
print(Avg)
> [3, 3, 5]
*注意第一个平均值应该是(3+3)/2,而不是(3+3)/3。所以用零填充数组不是一种选择。
【问题讨论】: