【问题标题】:How do I calculate the sum of the frequency of a variable with dplyr如何使用 dplyr 计算变量的频率之和
【发布时间】:2016-09-26 08:26:56
【问题描述】:

我正在处理 EU SILC 数据,并希望为家庭中的孩子数量创建一个变量。 我已经用个人资料(dhp)加入了户口本和户口资料。

我试过这段代码 dhpr <- left_join(dhp, perreg %>% group_by(idh) %>% summarise(nkids=sum(RX010<14)), by='idh') 其中 RX010 是采访当日的年龄。如果这样做,我得到的不是孩子的数量,而是家庭中最大孩子的年龄,例如:number of kids

我做错了什么?

【问题讨论】:

  • 请展示一个可重现的小例子和预期的输出(而不是图像)

标签: r dplyr


【解决方案1】:
dhpr <- left_join(dhp, perreg %>% group_by(idh) %>% 
  summarise(nkids=sum(ifelse(RX010<14,1,0))), by='idh')

可能会有所帮助。但是由于您没有提供一个可行的示例,所以这是在黑暗中拍摄。

【讨论】:

    最近更新 更多