【发布时间】:2017-08-19 16:08:52
【问题描述】:
我正在尝试减去 CSV 中的两列以创建第三列“持续时间” 结束时间 - 开始时间
每一行也对应一个用户ID。
我可以创建一个仅包含 Duration 列的 csv 文件,但我宁愿将其重定向回原始 csv。
例如,这些时间的格式为 2016-11-12 01:25:24+00 - 2016-11-12 01:25:20+00 >
到目前为止,我已经做到了
start_stop_sessions = pd.read_csv("start_stop_sessions.csv", parse_dates
['time_x', 'time_y'])
start_stop_sessions['time_delta'] = start_stop_sessions.time_y.values -
start_stop_sessions.time_x.values
Duration = (start_stop_sessions.time_delta)
print (Duration)
sys.stdout = open('Duration.csv', 'w')
Durationlist = ("Duration.csv")
max_value = max(Durationlist)
min_value = min(Durationlist)
我这样做对吗?
测试数据
time_x, anonymous_id, time_y
2016-11-20 18:35:57+00, 1, 2016-11-20 19:03:31+00
2016-11-21 19:33:06+, 2, 2016-11-21 19:45:47+00
2016-11-21 19:22:52+00, 3, 2016-11-21 19:26:02+00
1) 我需要创建第四列 Duration
2) 此持续时间列的 MIN、MAX、AVG 列表
【问题讨论】:
-
你检查过this吗?