【发布时间】:2016-09-16 17:24:41
【问题描述】:
我有一个包含特征 Date、Age 和 Customer_ID 的数据集。 Age 中的某些行中有缺失值 (NA),我想对它们进行估算。
以下是一些示例数据:
Date <- c("201101", "201102", "201101", "201102", "201103")
Age <- c("12-17", "12-17", "30-35", NA, NA)
Customer_ID <- c("1234", "1234", "5678", "5678", "5678")
df <- data.frame(Date, Age, Customer_ID)
Date Age Customer_ID
201101 12-17 1234
201102 12-17 1234
201101 30-35 5678
201102 NA 5678
201103 NA 5678
我想用 30-35 替换 Age 中的 NA。
因此,对于所有 NA,它必须检查是否有另一行具有相同的 Customer_ID,并将 NA 替换为另一行中所述的 Age 的值。
关于如何做到这一点的任何想法?谢谢。
【问题讨论】:
-
@SamFirke 你是对的,谢谢你的链接。