处理具有不同开始日期的时间序列

【问题标题】：Manipulating time series with different start dates处理具有不同开始日期的时间序列
【发布时间】：2020-01-25 10:31:46
【问题描述】：

我是一名 Python 程序员新手，有一个问题希望您能帮我解决。

我在 Pandas 中有两个时间序列，但它们的开始日期不同。假设一个从 1989 年开始，另一个从 2002 年开始。现在我想通过将两个系列索引到 2002 年（我有两个数据的第一个时间段）来比较两者的累积增长，并计算比率。

最好的方法是什么？理想情况下，脚本应该检查一对系列的最早可用数据是什么，并从那时起将两者索引到 100。

提前感谢您！

【问题讨论】：

标签： pandas time-series

【解决方案1】：

一个实用的解决方案可能是将数据框分成两列，每个时间序列一列，并为每个数据框添加一个“月年”列，仅列出月份和年份（例如 05-2015）。然后，您可以在该月份变量的两个数据帧上使用 pd.merge ，只保留它们发生月份重叠的行。函数为pd.merge(df1, df2, on='monthyear', how='inner')

您可以通过创建一个新的数据框并仅加载 1 列（或行，具体取决于您的数据框的外观）来拆分 pandas 数据框。 df1 = pd.Dataframe(original_dataframe[0]) 和 df2 = pd.Dataframe(original_dataframe[1])

【讨论】：