【发布时间】:2020-05-16 16:35:10
【问题描述】:
我有一个数据集 df,其中一列包含空白值,我需要填充这些值。如何用连续值填充空白“”字段? (我有一个包含超过 10,000 行的数据集)
Subject Folder
hi outlookdata
hi outlookdata
hi outlookdata
outlookdata
outlookdata
hello outlookdata
hello outlookdata
outlookdata
outlookdata
outlookdata
outlookdata
hi outlookdata
这是我想要的输出:
Subject Folder
hi outlookdata
hi outlookdata
hi outlookdata
a outlookdata
a outlookdata
hello outlookdata
hello outlookdata
b outlookdata
b outlookdata
b outlookdata
b outlookdata
goodbye outlookdata
这是我的数据的输入:
structure(list(Subject = structure(c(4L, 4L, 4L, 1L, 1L, 3L,
3L, 1L, 1L, 1L, 1L, 2L), .Label = c("", "goodbye", "hello", "hi"
), class = "factor"), Folder = structure(c(1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = "outlookdata", class = "factor")), class = "data.frame", row.names = c(NA,
-12L))
我不确定是否应该使用循环?
for (i in 1:nrow(df)){
if(df$Subject[i]=="")({
df$Subject[i]=df$Subject[i-1]
}
}
我希望替换“”的值是连续的。 任何建议都有帮助。
【问题讨论】: