【发布时间】:2020-02-04 02:01:02
【问题描述】:
我有一个包含电话号码、电子邮件和姓名的数据框。有些电子邮件是重复的,名称拼写不同。我真的不在乎留下哪个名字,所以我通过电子邮件分组,并总结选择首先观察姓名和电话号码。但是,有一些电子邮件地址丢失,但我想防止它们组合在一起,以便我可以保留唯一的电话号码。使用一个简化的例子,我的数据是:
data <- data.frame(x=c(1,2,3,4,5,5,5,6), y=c("a","b","c",NA,"d","d","d",NA))
data %>% group_by(y) %>% summarize(x=first(x))
当我这样做时,我失去了数字 6。如何防止 NA 组合在一起并被汇总?
【问题讨论】: