【发布时间】:2017-12-05 15:20:25
【问题描述】:
我有一个 pandas 数据框,其中一列 sign up 有多个空值。 sign up 列具有包含多个 OS 的分类值,例如 iOS、android、web 等。
我想从现有的OS 值中填充NA 值,但应根据OS 值的现有分布填充NA 值。
示例: 可以说,数据集的 OS 值计数分布如下:
signup
android web 14
ios web 16
mac 5
other 3
windows 6
Name: id, dtype: int64
我想根据上述不同 OS 值的分布来填充 NA 值。我想做的原因是保持当前分布,因为填充Mode 值可能会扭曲结果。
有人可以帮助如何实现这一目标。
【问题讨论】:
标签: python-2.7 python-3.x pandas numpy