【发布时间】:2017-02-15 07:59:19
【问题描述】:
我有一个由许多变量组成的全国性调查,比如这个(为了简洁起见,我省略了一些变量):
year id y.b sex income married pens weight
2002 1 1950 F 100000 1 0 1.12
2002 2 1943 M 55000 1 1 0.55
2004 1 1950 F 88000 1 1 1.1
2004 2 1943 M 66000 1 1 0.6
2006 3 1966 M 12000 0 1 0.23
2008 3 1966 M 24000 0 1 0.23
2008 4 1972 F 33000 1 0 0.66
2010 4 1972 F 35000 1 0 0.67
其中 id 是受访者,y.b 是出生年份,married 是一个虚拟变量(1 个已婚,0 个单身),pens 是一个虚拟变量,如果该人投资于补充养老金形式,则价值为 1; weight 是调查权重。
假设原始调查由 2002 年至 2014 年的 40k 观察组成(我对其进行了过滤,以便仅包含出现多次的个人)。我使用这个命令来创建一个调查对象:
d.s <- svydesign(ids=~1, data=df, weights=~weight)
既然 df 是加权的,我想找到例如投资补充养老金的女性百分比或已婚人士百分比;我在 R 帮助和网络上阅读以找到获取百分比的命令,但我没有找到正确的。
【问题讨论】:
-
所以这个百分比是
number of women that invest in complementary pension/total number of women,对吧?已婚人士也一样。到目前为止你有什么代码? -
正确的@not_a_robot。我使用了 svytable(~woman+obs, d.s),其中 obs 是观察的总数(我创建了一个变量 obs,其数字序列从 1 到结尾);我也使用了 svymean(~woman, d.s) 和 svyratio(~donna, ~obs, d.s) 但我没有得到我需要的东西。
标签: r percentage survey