【发布时间】:2019-04-29 11:48:36
【问题描述】:
我想将df 中的所有变量(但year 和gender)重新调整为一个特定的year,按gender 分组:
set.seed(1)
df <- data.frame(gender = c(rep("m", 5), rep("f", 5)), year = rep(1:5, 2), var_a = 1:10, var_b = 0:9)
df
gender year var_a var_b
1 m 1 1 0
2 m 2 2 1
3 m 3 3 2
4 m 4 4 3
5 m 5 5 4
6 f 1 6 5
7 f 2 7 6
8 f 3 8 7
9 f 4 9 8
10 f 5 10 9
我可以使用以下方法生成我期望的内容:
df %>% group_by(gender) %>% mutate(var_a = ifelse(year == 3, 0, var_a - var_a[year == 3])) %>%
mutate(var_b = ifelse(year == 3, 0, var_b - var_b[year == 3]))
gender year var_a var_b
<fct> <int> <dbl> <dbl>
1 m 1 -2 -2
2 m 2 -1 -1
3 m 3 0 0
4 m 4 1 1
5 m 5 2 2
6 f 1 -2 -2
7 f 2 -1 -1
8 f 3 0 0
9 f 4 1 1
10 f 5 2 2
但是,这不是一个选项,因为我的列太多。
所以我尝试了(没有成功):
df %>% group_by(gender) %>% mutate_at(vars(-gender, -year), ifelse(year == 3, 0, var_a - var_a[year == 3]))
ifelse(year == 3, 0, var_a - var_a[year == 3]) 中的错误:对象 未找到“年份”
如何使用vars(-col_name) 排除mutate_at(或替代方法)中的列名,同时仍读取这些列中的数据?
这与this one有关
【问题讨论】:
-
值得添加
sessionInfo()输出。