【问题标题】:Manipulating time series with different start dates处理具有不同开始日期的时间序列
【发布时间】:2020-01-25 10:31:46
【问题描述】:

我是一名 Python 程序员新手,有一个问题希望您能帮我解决。

我在 Pandas 中有两个时间序列,但它们的开始日期不同。假设一个从 1989 年开始,另一个从 2002 年开始。现在我想通过将两个系列索引到 2002 年(我有两个数据的第一个时间段)来比较两者的累积增长,并计算比率。

最好的方法是什么?理想情况下,脚本应该检查一对系列的最早可用数据是什么,并从那时起将两者索引到 100。

提前感谢您!

【问题讨论】:

    标签: pandas time-series


    【解决方案1】:

    一个实用的解决方案可能是将数据框分成两列,每个时间序列一列,并为每个数据框添加一个“月年”列,仅列出月份和年份(例如 05-2015)。然后,您可以在该月份变量的两个数据帧上使用 pd.merge ,只保留它们发生月份重叠的行。函数为pd.merge(df1, df2, on='monthyear', how='inner')

    您可以通过创建一个新的数据框并仅加载 1 列(或行,具体取决于您的数据框的外观)来拆分 pandas 数据框。 df1 = pd.Dataframe(original_dataframe[0])df2 = pd.Dataframe(original_dataframe[1])

    【讨论】:

      猜你喜欢
      • 2020-07-02
      • 1970-01-01
      • 1970-01-01
      • 2017-01-06
      • 1970-01-01
      • 2022-01-21
      • 2019-03-07
      • 2011-11-27
      • 1970-01-01
      相关资源
      最近更新 更多