【发布时间】:2019-05-19 20:37:31
【问题描述】:
有没有办法同时替换分类列和数值列中的 NAN 值?
一个非常简单的例子:
data = {'col_1': [3, np.nan, 1, 2], 'col_2': ['a', 'a', np.nan, 'd']}
df = pd.DataFrame.from_dict(data)
数据框:
col_1 col_2
0 3.0 a
1 NaN a
2 1.0 NaN
3 0.0 d
目标:
用col_1的mean替换col_1的NAN,用col_2的mode ('a')替换col_2的NAN。
现在,我必须为每一列单独替换它。如果所有列都是数字或分类的,那么这很容易,因为该操作可以应用于整个数据框,但我找不到一种方法来为混合数据框做一行。
【问题讨论】:
-
是
col2只是object或categorydtype? -
@ALollz 在我的实际数据集中,它的
categorydtype。