【发布时间】:2021-02-24 00:04:13
【问题描述】:
我有多个columns,其中有missing values。我想在所有年份中使用同一天的mean,而filling 使用每个column 的missing 数据。例如,DF 是我的假数据,我在其中看到 two columns (A & X) 的 missing 值
library(lubridate)
library(tidyverse)
library(naniar)
set.seed(123)
DF <- data.frame(Date = seq(as.Date("1985-01-01"), to = as.Date("1987-12-31"), by = "day"),
A = sample(1:10,1095, replace = T), X = sample(5:15,1095, replace = T)) %>%
replace_with_na(replace = list(A = 2, X = 5))
到Column A中的fill,我使用下面的代码
Fill_DF_A <- DF %>%
mutate(Year = year(Date), Month = month(Date), Day = day(Date)) %>%
group_by(Year, Day) %>%
mutate(A = ifelse(is.na(A), mean(A, na.rm=TRUE), A))
我的data.frame 中有很多columns,我想将其概括为所有columns 以填补缺失值?
【问题讨论】:
标签: r dataframe tidyverse na missing-data