【发布时间】:2016-04-07 10:59:49
【问题描述】:
我有一个数据分析任务,我想在其中分析实时服务日志。您能帮我在 Pandas 中如何做到这一点吗?
我想为每个服务名称生成时间序列,并在此基础上进行相关性分析。
如何通过聚合它们各自的数据,为每个服务名称将这个数据帧划分为不同的数据帧(以时隙为索引),如下所示?
Ps:我见过类似的问题,但我相信我的问题是不同的,因为我想从数据框中生成许多时间序列。如果这很简单,请提前抱歉,我是 Pandas 的新手 :)
这是我的数据框代码:
ERRORCODE ERRORTEXT SERVICENAME REQTDURATION RESPTDURATION HOSTDURATION
10:00:27:000 NaN NaN serviceA 0 1 4612
10:00:27:822 NaN NaN serviceB 0 1 14994
10:01:27:622 -1 'Timeout' serviceA 1 0 7695
10:01:27:323 NaN NaN serviceD 0 1 2612
10:01:27:755 NaN NaN serviceA 0 1 1612
10:02:27:666 -5 'Timeout' serviceA 0 1 11612
10:02:27:111 NaN NaN serviceB 0 1 111112
10:02:27:333 NaN NaN serviceC 0 1 412
【问题讨论】:
标签: python numpy pandas time-series data-analysis