【发布时间】:2021-03-07 19:30:59
【问题描述】:
如何将此 Stata 命令转换为 R?
我有一个由个人组成的数据库(每个人都是一行),但我还需要一些家庭变量来分析。在这种情况下,我想要确定每个家庭的收入总额。 一个家庭的每个成员都是数据库中的一个个体,虽然我没有这些个体;标识,我有一个标识家庭的变量。 . 因为我也知道,对于每个人,2014 年的收入,在 Stata 我有这个命令来创建变量:
egen family_inc = total(annual_inc), by (id_family)
在哪里
family_inc是一个家庭的总收入
annual_inc 是个人赚取的总收入
id_family是数据中这个家族的标识
所以命令对 Stata 说:
(1) 对于id_family的每个成员;
(2) 找到该家族的所有成员;
(3) 合计2014年的收入;
(4) 将此值赋给一个新变量family_inc。
我可以为此使用group_by() 吗?我在 R. 非常n00b。由于截止日期,我现在不能抽出一些时间来学习课程! course(df_damn, mother = FALSE, explicit = 3, !is.numeric("loads of"))
【问题讨论】:
-
假设您在 R 中的数据对象被命名为 dat,然后执行
dat %>% group_by(id_family) %>% mutate(family_inc = sum(annual_inc, na.rm=TRUE))Thanks @r2evans。 -
这工作:
iris %>% group_by(Species) %>% mutate(pl_species = sum(Petal.Length, na.rm=TRUE)) -
什么是
pl_species?在 iris 上找不到它。 -
这是被创建的新变量的名称。
-
通常,在 cmets 中得到回答的问题不会被标记为已回答。它一直在发生。