【问题标题】:How to apply a cumulative function pandas dataframe but restart the cumulative function when a different column changes?如何应用累积函数熊猫数据框但在不同列更改时重新启动累积函数?
【发布时间】:2023-03-20 03:18:01
【问题描述】:

这对我来说是一个相当困难的问题。答案可能很简单,但我被困住了。基本上,我有一个来自 simfin.com 的批量资产负债表数据框。我想获得Retained Earnings 列中的百分比变化,但在每个新代码处重新开始累积。

      Ticker  Fiscal Year Fiscal Period  Retained Earnings
0          A         2016            Q1       5.666000e+09
1          A         2016            Q2       5.720000e+09
2          A         2016            Q3       6.000000e+09
3          A         2016            Q4       6.089000e+09
4          A         2017            Q1      -4.530000e+08
...      ...          ...           ...                ...
36669   ZYXI         2019            Q3       1.140900e+07
36670   ZYXI         2019            Q4       1.435600e+07
36671   ZYXI         2020            Q1       1.729300e+07
36672   ZYXI         2020            Q2       2.031000e+07
36673   ZYXI         2020            Q3       2.164300e+07

我该怎么做?

【问题讨论】:

  • 也许您可以通过代码进行分组并计算每个组的累积变化,然后将结果连接在一起?
  • 试试df.groupby('Ticker')['Retained Earnings'].pct_change()

标签: python pandas data-science finance


【解决方案1】:

找到了解决办法。

data["Retained Earnings pct change"] = data.groupby("Ticker")["Retained Earnings"].pct_change()

感谢斯科特的帮助。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-05-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-04-03
    • 2017-05-15
    • 1970-01-01
    相关资源
    最近更新 更多