【问题标题】:Create a new dataset with one case for each value of a variable in the original dataset为原始数据集中变量的每个值创建一个新数据集
【发布时间】:2017-06-14 00:15:04
【问题描述】:

我有一个数据集,其中每个案例都是一个学生,我有一个性别变量 (SEX) 和一个专业变量 (MAJOR)。性别变量有 2 个可能的值(男性和女性),而专业的变量有几十个(生物学、数学等)。

我想使用该数据集创建另一个数据集,其中每个主要的一个案例和 3 个变量:MAJOR、MALE 和 FEMALE。每个专业的变量 MALE 的值应该是注册该专业的男性人数,变量 FEMALE 的值应该是注册该专业的女性人数。 MAJOR 的值应该只是该案例对应的原始数据集中变量 MAJOR 的值的标签。

很清楚,当我查看要创建的数据集时,每个专业应该有一行,其中一列 MAJOR 包含每个专业的标签,一列 MALE 包含注册的男性人数在每个专业中,在 FEMALE 的一列中包含每个专业就读的女性人数。

我的数据集是用 SPSS 创建的,我从来没有使用过那个程序,所以我不知道该怎么做,尽管它可能很容易。非常感谢您的帮助!

最好, 菲利普

【问题讨论】:

    标签: spss


    【解决方案1】:

    打开文件后,打开一个新的语法窗口,将以下代码放入其中并运行它:

    dataset name OrigFile.
    compute male=(SEX="MALE").
    compute female=(SEX="FEMALE").
    dataset declare NewFile.
    aggregate /outfile='NewFile' /break=major /male female=sum(male female).
    

    运行此程序后,您将拥有两个打开的数据集 - 原始数据集和您想要创建的新数据集。

    【讨论】:

    • 非常感谢。
    • 我接受了答案并尝试投票,但显然我的声誉还不够高,无法被看到。
    • 我对你的答案投了赞成票,@eli-k,因为我有足够的声誉,这是一个很好、正确的答案!我知道作为 SPSS 14 版 PC 用户,很久以前!
    • 我也刚投了赞成票,因为我现在有足够的声誉:-)
    猜你喜欢
    • 2016-09-14
    • 2021-07-19
    • 1970-01-01
    • 1970-01-01
    • 2018-04-25
    • 1970-01-01
    • 2016-03-16
    • 2017-01-10
    • 2011-02-16
    相关资源
    最近更新 更多