【发布时间】:2021-07-02 07:35:01
【问题描述】:
我正在尝试根据创建时间对 .txt 文件进行排序。每天在几分钟内多次创建一组 6-8 个 .txt 文件。我不知道确切的时间间隔,我必须找到一种方法来自动找到最接近的匹配日期时间(例如,所有时间间隔小于 15 分钟)。我已经能够为每个文件提取 DateTime。现在,我想分配一个组标签,指示已在一组中创建了哪些 .txt 文件(即彼此相隔几分钟内)。
我当前的 df 如下所示:
index values
2020-09-06 17:25:14 97
2020-09-06 17:25:33 0
2020-09-06 17:27:00 3
2020-09-06 17:28:13 7
2020-09-06 17:29:28 10
2020-09-06 17:30:07 26
2020-09-06 17:30:40 34
2020-09-06 17:31:13 34
2020-09-06 18:07:34 99
2020-09-06 18:08:07 0
2020-09-06 18:08:35 3
2020-09-06 18:09:00 8
2020-09-06 18:09:24 11
2020-09-06 18:09:57 32
2020-09-06 18:10:24 43
2020-09-06 19:03:45 99
2020-09-06 19:04:31 0
我想自动为 17:25 到 17:31 之间的所有行分配标签“a”,然后为 18:07 到 18:10 之间的所有行分配标签“b”,然后为所有行分配标签“c” 19:03 到 19:04 之间。
我发现的大多数解决方案,只有聚合(pd.groupby()、pd.resample()、pd.grouper())。我可以使用其中一种方法来创建我的标签吗?
我认为this 可能是一个有用的开始,但据我了解解决方案,它只为我创建指定索引的某个索引。
谢谢(如果可以的话,我很乐意在这里分享一个示例 .txt 文件和我的代码?)
【问题讨论】:
标签: python pandas dataframe datetime intervals