【发布时间】:2018-01-27 13:20:44
【问题描述】:
假设我有一个缺失值的数据框,如下所示:
import pandas as pd
df = pd.DataFrame([[1,3,'NA',2], [0,1,1,3], [1,2,'NA',1]], columns=['W', 'X', 'Y', 'Z'])
print(df)
变量 Y 缺少两个值。假设我运行了一些插补模型并估算出这两个值应该是什么:
to_impute = [2,1]
用这两个值替换两个 NA 的最佳方法是什么?我知道相当迂回的方式,例如循环 to_impute 并使用 df.iloc 添加每个值。但我希望有一种简洁且非迭代的方式。
(这在 R 中很容易,我希望在 Pandas 中也很容易。)
【问题讨论】:
标签: pandas imputation