【问题标题】:create a python dataframe from existing dataframe groupby a columns with min, max, mean and median values从现有数据框 groupby 具有最小值、最大值、平均值和中值的列创建 python 数据框
【发布时间】:2018-02-01 17:11:04
【问题描述】:

这就是我的数据框的样子。

A B C
冰固的凯特 冰固杰克 固体杰克 茶液礼来 茶固体杰克 液体凯特 茶液 苹果 冰液苹果我想用A groupby B的“最常见”值填充A的缺失值
因此,B 列的缺失值将是 ice,其值为 solidtea 的值为 liquid,基于它们的值分组。
我怎样才能做到这一点。

【问题讨论】:

  • 感谢您发布示例数据。请参阅stackoverflow.com/help/mcve 了解有关发布问题的提示。到目前为止,您尝试过什么代码?输出或错误消息是什么?
  • 比如你能不能试试这个解决方案:stackoverflow.com/questions/42789324/pandas-fillna-mode
  • @Evan - 我已经编辑了这个问题。我已经尝试过您提到的链接中给出的代码。但它所做的是用列的一个最常见值填充所有 NaN。但我需要的是它应该根据 B 分组的 A 的“最常见”值来填充。

标签: python pandas dataframe missing-data data-extraction


【解决方案1】:

我就是这样解决的。

df['A'] = df.groupby('Outlet_Type').A.transform(lambda x: x.fillna(x.mode()[0]))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-08-01
    • 1970-01-01
    • 2012-01-21
    • 2018-07-07
    • 2020-07-13
    • 1970-01-01
    相关资源
    最近更新 更多