【发布时间】:2021-06-18 12:47:46
【问题描述】:
我正在尝试首先对整个 DF 中的连续变量进行归一化,然后在组内再次进行归一化。
这是一个示例 DF
ave_win_last5 id_race
0 6.00 6734
1 3.25 6734
2 6.75 6734
3 5.50 6734
4 5.50 6734
我可以使用 df 在 df 中进行标准化
x_var['ave_win_last5'] = (x_var['ave_win_last5']-x_var['ave_win_last5'].mean())/x_var['ave_win_last5'].std()
但是,当我尝试在组内进行标准化时,输出全部为 NAN
x_var['ave_win_last5'] = (x_var['ave_win_last5'] -x_var.groupby('id_race')['ave_win_last5'].mean())/x_var.groupby('id_race')['ave_win_last5'].std()
ave_win_last5 id_race
0 NaN 6734
1 NaN 6734
2 NaN 6734
3 NaN 6734
4 NaN 6734
我不确定为什么返回 NaN。
【问题讨论】:
标签: python pandas dataframe normalize