如何应用累积函数熊猫数据框但在不同列更改时重新启动累积函数？答案

【问题标题】：How to apply a cumulative function pandas dataframe but restart the cumulative function when a different column changes?如何应用累积函数熊猫数据框但在不同列更改时重新启动累积函数？
【发布时间】：2023-03-20 03:18:01
【问题描述】：

这对我来说是一个相当困难的问题。答案可能很简单，但我被困住了。基本上，我有一个来自 simfin.com 的批量资产负债表数据框。我想获得Retained Earnings 列中的百分比变化，但在每个新代码处重新开始累积。

      Ticker  Fiscal Year Fiscal Period  Retained Earnings
0          A         2016            Q1       5.666000e+09
1          A         2016            Q2       5.720000e+09
2          A         2016            Q3       6.000000e+09
3          A         2016            Q4       6.089000e+09
4          A         2017            Q1      -4.530000e+08
...      ...          ...           ...                ...
36669   ZYXI         2019            Q3       1.140900e+07
36670   ZYXI         2019            Q4       1.435600e+07
36671   ZYXI         2020            Q1       1.729300e+07
36672   ZYXI         2020            Q2       2.031000e+07
36673   ZYXI         2020            Q3       2.164300e+07

我该怎么做？

【问题讨论】：

也许您可以通过代码进行分组并计算每个组的累积变化，然后将结果连接在一起？
试试df.groupby('Ticker')['Retained Earnings'].pct_change()

标签： python pandas data-science finance

【解决方案1】：

找到了解决办法。

data["Retained Earnings pct change"] = data.groupby("Ticker")["Retained Earnings"].pct_change()

感谢斯科特的帮助。

【讨论】：