【发布时间】:2019-08-30 07:43:24
【问题描述】:
我有两个文本文件。两者都像下面有很多原料:
2014-09-06 12:18:29 0 7Z
2014-09-06 21:00:41 0 7Z
2014-09-06 02:28:06 0 7Z
2014-09-06 13:06:53 0 7Z
我想比较这两个文件并制作第二列的新文件,其中第二列在两个文件中相似。但关键是第二列是时间戳,我想计算两个文件中的列,当它们相似或最大相差 5 秒时。例如,对于我上面示例中的第一个原始数据,如果在另一个文件中我们的第二列在此范围内:“12:18:29 到 12:18:34”,则该原始数据将被视为相似。
我阅读第一个文件是这样的:
f= open ('green.txt','r')
f= open ('red.txt','r')
with open ('common', 'w') as h:
for line in f:
elements = line.split (' ')
data = elements [1]
但是因为我想比较时间戳我不知道该怎么做。在我的代码中,数据将是字符串。
【问题讨论】:
-
不要自己解析文件 - 尝试使用 pandas:pandas.pydata.org/pandas-docs/stable/reference/api/… 这样数据操作也会更容易。