【发布时间】:2016-07-24 14:58:29
【问题描述】:
我有一个熊猫数据框,其中有几个缺失值。我注意到非缺失值彼此接近。因此,我想通过随机选择非缺失值来估算缺失值。
例如:
import pandas as pd
import random
import numpy as np
foo = pd.DataFrame({'A': [2, 3, np.nan, 5, np.nan], 'B':[np.nan, 4, 2, np.nan, 5]})
foo
A B
0 2 NaN
1 3 4
2 NaN 2
3 5 NaN
4 NaN 5
我想例如 foo['A'][2]=2 和 foo['A'][5]=3
我的 pandas DataFrame 的形状是 (6940,154)。
我试试这个
foo['A'] = foo['A'].fillna(random.choice(foo['A'].values.tolist()))
但它不起作用。你能帮我实现吗?最好的问候。
【问题讨论】:
标签: python pandas missing-data