【问题标题】:Python Pandas: Passing arguments to a function in agg()Python Pandas:将参数传递给 agg() 中的函数
【发布时间】:2017-11-18 12:13:25
【问题描述】:

我正在尝试通过使用不同类型的函数和参数值来减少熊猫数据框中的数据。但是,我没有设法更改聚合函数中的默认参数。这是一个例子:

>>> df = pd.DataFrame({'x': [1,np.nan,2,1],
...                    'y': ['a','a','b','b']})
>>> df
     x  y
0  1.0  a
1  NaN  a
2  2.0  b
3  1.0  b

这是一个聚合函数,我想测试b的不同值:

>>> def translate_mean(x, b=10):
...   y = [elem + b for elem in x]
...   return np.mean(y)

在下面的代码中,我可以将这个函数与默认的b 值一起使用,但我想传递其他值:

>>> df.groupby('y').agg(translate_mean)
      x
y
a   NaN
b  11.5

有什么想法吗?

【问题讨论】:

标签: python pandas group-by aggregate


【解决方案1】:

只需将作为参数传递给agg(这也适用于apply)。

df.groupby('y').agg(translate_mean, b=4)
Out: 
     x
y     
a  NaN
b  5.5

【讨论】:

  • 缺少使用lambas,在跨多个函数聚合时这可能吗?例如,df.groupby('y').agg([translate_mean, translate_mean]),我想先翻译 4,然后翻译 8?
【解决方案2】:

也许你可以尝试在这种情况下使用apply

df.groupby('y').apply(lambda x: translate_mean(x['x'], 20))

现在结果是:

y
a     NaN
b    21.5

【讨论】:

    【解决方案3】:

    万一您有多个列,并且您想为每列应用不同的函数和不同的参数,您可以将 lambda 函数与 agg 函数一起使用。 例如:

    >>> df = pd.DataFrame({'x': [1,np.nan,2,1],
    ...                    'y': ['a','a','b','b']
                           'z': ['0.1','0.2','0.3','0.4']})
    >>> df
         x  y  z
    0  1.0  a  0.1
    1  NaN  a  0.2
    2  2.0  b  0.3
    3  1.0     0.4
    
    >>> def translate_mean(x, b=10):
    ...   y = [elem + b for elem in x]
    ...   return np.mean(y)
    

    对列“y”进行分组,并为列“x”应用函数 translate_mean,b=10; b=25 for col 'z',你可以试试这个:

    df_res = df.groupby(by='a').agg({
        'x': lambda x: translate_mean(x, 10),
        'z': lambda x: translate_mean(x, 25)})
    

    希望对您有所帮助。

    【讨论】:

      猜你喜欢
      • 2014-12-08
      • 2013-07-08
      • 2017-08-31
      • 2015-01-23
      • 1970-01-01
      • 1970-01-01
      • 2013-06-23
      相关资源
      最近更新 更多