【发布时间】:2020-10-09 07:27:04
【问题描述】:
我有一个由两列组成的数据框:ID 和 date_time。 ID 表示谁正在被记录,而 date_time 表示何时。请参阅下面的数据框。
我想根据这个数据框计算一个新的数据框,它包含三列:“Measurement”、“ID”和“Date”。
- “测量”。此列应说明这是给定 ID 的数字测量值。测量从 23:00:00 开始,然后一直运行到第二天的 22:59:59。然而,测量在随机时间开始,因此第一次测量的持续时间不是 24 小时。最后一次测量也不是 24 小时。
- “身份证”。指明给定测量的 ID
- “日期”。此列应显示给定测量中最后一次记录的日期,格式为:yyyy.mm.dd。
每个唯一测量值都应该有一行
structure(list(date_time = c("2020.03.02 22:00:17", "2020.03.02 22:05:17",
"2020.03.02 22:10:17", "2020.03.02 22:35:17", "2020.03.02 22:40:17",
"2020.03.02 22:45:17", "2020.03.02 22:50:17", "2020.03.02 22:55:17",
"2020.03.02 23:00:17", "2020.03.02 23:05:17", "2020.03.02 23:10:17",
"2020.03.02 23:15:17", "2020.03.02 23:20:17", "2020.03.02 23:25:17",
"2020.03.02 23:30:17", "2020.03.02 23:35:17", "2020.03.02 23:40:17",
"2020.03.02 23:45:17", "2020.03.02 23:50:17", "2020.03.02 23:55:17",
"2020.03.03 00:00:17", "2020.03.03 00:55:17", "2020.03.03 01:00:17",
"2020.03.03 01:05:17", "2020.03.03 01:10:17", "2020.03.03 01:15:17",
"2020.03.03 01:20:17", "2020.03.03 01:25:17", "2020.05.09 08:39:32",
"2020.05.09 08:39:32", "2020.05.09 08:39:32", "2020.05.09 08:39:32",
"2020.05.09 08:39:32", "2020.05.09 08:39:32", "2020.05.09 08:39:32",
"2020.05.09 08:39:32", "2020.05.09 08:39:32", "2020.05.09 08:39:32",
"2020.05.09 08:39:32", "2020.05.09 08:39:32", "2020.05.09 08:39:32",
"2020.05.09 08:39:32", "2020.05.09 08:39:32", "2020.05.09 08:39:32",
"2020.05.09 08:39:32", "2020.05.09 08:39:32"), id = c(12L, 12L,
12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L,
12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L, 12L,
13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L, 13L,
13L, 13L, 13L, 13L, 13L)), row.names = c(NA, 46L), class = "data.frame")
#Expected output:
output <- read.table(header=TRUE, text ="
ID Date Measurement
12 2020.03.02 1
12 2020.03.03 2
13 2020.05.09 1
")
我是 R 新手,并尝试使用 tidyverse。 非常感谢所有帮助,谢谢!
【问题讨论】:
-
你能分享预期的输出吗?另外,列 ID 是指“案例”列吗?
-
感谢您的评论!我可以看到我的问题在几个方面都不清楚。我已经尝试改进它。如果仍有任何不清楚的地方,请告诉我。
-
在您的问题中您说您的预期输出有 3 列,但在您显示的预期输出中只有两列。你能让它保持一致吗?此外,目前我还不清楚什么是测量值以及您希望看到的数字。
-
是的,我可以看到我的问题仍然不清楚。我已经编辑了文本以使其更清晰。感谢您解决这个问题。
-
您的问题仍然不清楚如何获得测量值。您在上面发布的示例数据是您在底部显示的预期输出吗?那么您不符合您的标准 #3,因为它不是 ID 13 的“最后录制日期”。