【问题标题】:Calculate standard deviation for intervals in dataframe column计算数据框列中间隔的标准偏差
【发布时间】:2021-10-01 08:01:47
【问题描述】:

我想计算非滚动间隔的标准偏差。

我有一个这样的 df:

value std year
  3   nan 2001
  2   nan 2001
  4   nan 2001
 19   nan 2002
 23   nan 2002
 34   nan 2002

等等。我只想计算每年的标准偏差并将其保存在“std”中相应行的每个单元格中。我每年都有相同数量的数据,因此间隔的长度永远不会改变。

我已经试过了:

df["std"] = df.groupby("year").std()

但是由于右边给出了一个新的数据框,它为按年份计算的每一列计算标准值,这显然不起作用。

非常感谢大家的支持!

【问题讨论】:

    标签: python pandas statistics standard-deviation


    【解决方案1】:

    IIUC:

    通过transform()方法试试:

    df['std']=df.groupby("year")['value'].transform('std')
    

    如果要求多列的标准差,那么:

    df[['std1','std2']]=df.groupby("year")[['column1','column2']].transform('std')
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-04-29
      • 2021-06-14
      • 1970-01-01
      • 1970-01-01
      • 2020-03-28
      • 1970-01-01
      • 2017-09-26
      • 1970-01-01
      相关资源
      最近更新 更多