【发布时间】:2021-06-13 12:46:19
【问题描述】:
我有一个如下所示的数据集:
YEAR ID_HOUSEHOLD Size n_fem n_male n_Sec_Edu n_High_Edu n_emp n_noemp n_stud poverty_t
2017 320 5 2 3 0 0 1 1 3 -1
2017 300 1 1 0 0 0 0 1 1 2
2017 150 6 3 3 4 1 2 1 4 1
2017 170 3 3 1 2 1 2 0 0 0
2017 420 4 2 2 0 4 2 0 2 -1
2017 430 2 1 1 0 2 2 0 2 0
从这个表中,我想创建一个道具表,根据最后一个变量的类型来说明所有变量的比例。我想按行获取比例,即第一行应该说明样本中女性的比例分布在 -1、1、0 和 2 组中。
对于第一行,我将总结 n_female=12 (2+1+3+3+2+1) 的值。然后将每个类别的值相加并除以总数:
-1 1 0 2
n_female (4/12)0.33 (3/12)0.25 (4/12)0.33 (1/12)0.083
n_male
n_sec_edu
n_high_edu
n_emp
n_noemp
n_stu
【问题讨论】:
-
您能否在该表中填写更多数据以显示您想要的内容?
-
我已经编辑了这个问题,但总的来说我想按列查找每行的比例。我不知道如何总结第一个数据集的每一列的值,以根据最后一个变量按列分配它们并获得比例。
-
你是如何进行计算的?你能解释一下第一行的计算吗?
-
我已经编辑了第一行。基本上,我会总结 n_female=12 (2+1+3+3+2+1) 的值。然后将每个类别的值相加,然后除以总数。我不知道如何使用 R 中更大的数据集来做到这一点
标签: r