【发布时间】:2019-03-28 09:37:11
【问题描述】:
我正在对与我们生产的不同产品相关的每个流程的周期时间变化进行分析。我们的 SAP 数据包含工人的开始和结束日志条目,目标是使用此信息计算周期时间。
但是,SAP 将开始和结束时间戳导出在一列中,并且没有可用的参考列说明什么是开始时间和什么是结束时间。这使得使用例如整理数据传播是不可能的。
当前数据
- 160 万行
- 150 次操作
- 万单
。一小部分数据样本如下所示。
Order <- rep(c(1059866,1059891),each = 4)
Operation <- rep(c(1510,1550),4)
Timestamp <- c("30-11-2016 07:33:30", "30-11-2016 07:33:42", "30-11-2016 16:00:13", "30-11-2016 16:00:18", "30-11-2016 07:35:21", "30-11-2016 07:35:43", "30-11-2016 16:00:43", "30-11-2016 16:00:39")
df_current <- cbind(Order, Operation, Timestamp)
每个流程步骤(“操作”)都需要此开始和结束信息。 逻辑上最早的时间戳是开始日志条目,而最新的时间戳是完成日志条目。
但是我不知道如何告诉 R 创建一个新列,该列根据时间戳正确指示哪个时间戳是开始和结束的。
所需数据
Order <- rep(c(1059866,1059891),each = 4)
Operation <- rep(c(1510,1550),4)
Timestamp <- c("30-11-2016 07:33:30", "30-11-2016 07:33:42", "30-11-2016 16:00:13", "30-11-2016 16:00:18", "30-11-2016 07:35:21", "30-11-2016 07:35:43", "30-11-2016 16:00:43", "30-11-2016 16:00:39")
Status <- c("Start" , "Finish", "Start" , "Finish", "Start" , "Finish", "Finish", "Start")
df_desired <- cbind(Order, Operation, Timestamp, Status)
当数据看起来像这样时,我可以轻松整理数据。
谢谢
【问题讨论】: