【问题标题】:update column value of pandas groupby().last()更新熊猫 groupby().last() 的列值
【发布时间】:2018-02-01 10:05:28
【问题描述】:

给定数据框:

dfd = pd.DataFrame({'A': [1, 1, 2,2,3,3],
                    'B': [4, 5, 6,7,8,9],
                    'C':['a','b','c','c','d','e']
                   })

我可以通过使用找到每个A组的最后一个C值

dfd.groupby('A').last()['C']

但是,我想将 C 值更新为 np.nan。我不知道该怎么做。方法如:

def replace(df):
    df['C']=np.nan
    return replace

dfd.groupby('A').last().apply(lambda dfd: replace(dfd))

不起作用。

我想要这样的结果:

dfd_result= pd.DataFrame({'A': [1, 1, 2,2,3,3],
                    'B': [4, 5, 6,7,8,9],
                    'C':['a',np.nan,'c',np.nan,'d',np.nan]
                   })

【问题讨论】:

    标签: python pandas lambda apply pandas-groupby


    【解决方案1】:

    IIUIC,你需要loc。使用tail获取最后一个值的索引

    In [1145]: dfd.loc[dfd.groupby('A')['C'].tail(1).index, 'C'] = np.nan
    
    In [1146]: dfd
    Out[1146]:
       A  B    C
    0  1  4    a
    1  1  5  NaN
    2  2  6    c
    3  2  7  NaN
    4  3  8    d
    5  3  9  NaN
    

    dfd.loc[dfd.groupby('A').tail(1).index, 'C'] = np.nan 也应该没问题。

    【讨论】:

    • 请看我的更新示例,其中 C 列不包含数字。
    • 谢谢。我认为您已经稍微更改了代码。稍后我会尝试并告诉你结果。
    猜你喜欢
    • 2019-04-21
    • 1970-01-01
    • 1970-01-01
    • 2018-12-29
    • 2018-05-15
    • 1970-01-01
    • 2019-02-24
    • 1970-01-01
    • 2016-08-31
    相关资源
    最近更新 更多