【发布时间】:2018-09-23 03:52:07
【问题描述】:
是否可以估算特定列的值?
例如,如果我有 3 列:
- A(分类):不包含任何缺失值
- B(数字):不包含任何缺失值
- C:假设此列包含数字数据,其中一些数据缺失。我只想在本专栏中进行估算。
【问题讨论】:
-
是 A,B 整数、数字、分类吗?
-
@smci:假设 A 是分类的,B 是数字的
-
您是尝试从 A、B、C(多重插补)还是仅从 C(单一插补)进行插补?我认为您正在尝试做前者。
-
首先您需要通过编码将分类数据转换为数值。然后可以使用回归模型来预测缺失值。
-
@smci:抱歉我的回复晚了。我只想在 C 列中进行估算(单次估算)
标签: pandas dataframe scikit-learn na imputation