【发布时间】:2021-07-08 08:20:03
【问题描述】:
我正在使用不同的数据源并将每个数据存储在不同的数据框中。我想将这些数据帧统一成一个大数据框,但首先我需要统一它们的索引。一些数据帧的索引遵循格式 YYYY-MM-DD,其他使用 YYYYTNN,n=1,2,3,4,最后一种格式是 YYYYMNN,N 从 01 到 12。
它们代表日期,一年中的三个月和一年中的一个月。数学上很容易将它们全部转换为第一种格式,但我正在考虑是否有某种方法可以用 Python 编写,这样我就不必手动更改所有数据索引。索引只是文本片段,所以我不知道如何读取 YYYYTN 并检测 T 的值。
提前谢谢你。
【问题讨论】:
-
一些数据帧的索引,其他的 ..。全部尝试
df.index = pd.to_datetime(df.index)? -
在格式为 YYYYMNN(每月 1 个值)的情况下,我收到错误代码“ParserError: minute must be in 0..59: 2021M02”。它适用于格式为 YYYYTNN(每年 4 个值)的那些,但它将 4 个值写入一年中的前 4 个月每月一个值,实际上每个值代表 3 个月,所以它应该类似于 1 月 1 日、4 月 1 日、7 月 1 日和 10 月 1 日。你知道我如何在命令中提供这些信息吗?
标签: python pandas dataframe indexing