【发布时间】:2021-01-17 09:20:23
【问题描述】:
我在数据框中有一列包含数值(例如年龄),并希望将其分成几个类别(或范围),如下所示:
df['Age_binned'] = pd.qcut(df['Age'], 5, duplicates='drop')
产生以下范围:
(-0.001, 36.0]
(36.0, 45.0]
(45.0, 54.0]
(54.0, 62.0]
(62.0, 87.0]
但是,我知道此列还包含一些 NaN 值,我想将其视为单独的 bin。我怎样才能做到这一点?
我厌倦了使用.fillna(),但是如果我用数值填充NaN,它会与上面的bin 合并,而.qcut() 方法似乎会忽略非数值。
【问题讨论】:
-
请提供样本数据和预期输出
-
@Arun,我还能提供什么?我希望
NaN也出现在.qcut()方法返回的范围列表中,作为一个单独的类别。