【发布时间】:2017-11-16 20:25:05
【问题描述】:
我在 SPSS 中有一个大型数据集如下:
Col_1 Col_2 Qty
a x 5
a x 5
a y 2
b x 1
b y 6
b y 7
c y 4
c z 10
c z 11
d x 2
我使用以下语法聚合数据集:
AGGREGATE
/OUTFILE='agg'
/PRESORTED
/BREAK=Col_1 Col_2
/Qty_sum=SUM(Qty).
这是我得到的结果:
Col_1 Col_2 Qty_sum
a x 10
a y 2
b x 1
b y 13
c y 4
c z 21
d x 2
除此之外,我希望结果给我一个百分比如下:
Col_1 Col_2 Qty_sum Percent
a x 10 83%
a y 2 17%
b x 1 7%
b y 13 93%
c y 4 16%
c z 21 84%
d x 2 100%
Percent 列的百分比显示Qty_sum 在Col_2 中的值之间的分布情况。
由于Col_1 和Col_2 中数据的记录方式不一致,因此我不能对整个数据集使用通用公式。
我无法使用Sumifs 函数在Excel 中工作,因为数据集对于Excel 来说太大了。
我尝试在Crosstabs 函数中使用Row Percentages 选项,但这仅适用于获取两行分类变量的计数。
代替SPSS,请让我知道这是否也可以在R 中完成。
【问题讨论】:
标签: r excel syntax aggregate spss