【问题标题】:SPSS - merging files with duplicate cases of ID variable and new cases/variablesSPSS - 合并具有ID变量重复案例和新案例/变量的文件
【发布时间】:2017-02-20 19:02:53
【问题描述】:

我有一个用于多年商店访问的管理数据集,我试图将其合并到 ID 变量下。

每个数据集都有一个 ID 的重复项,这些重复项出现在不同的商店访问期间,由 Date 注释。一些较新的数据文件还包含旧数据文件中未包含的新变量 (Y)。来自不同年份的数据集也将包含不同ID 表示的不同案例。此外,某些变量对于每种情况可能是相同的,但在不同的日期。我希望合并后的文件保留这些重复项。

示例数据文件:

文件 1

ID Date X
1  3    4
1  5    3
2  1    4

文件 2

ID Date X  Y
1  6    4  2
1  7    1  5
2  8    4  7
3  7    2  3

我希望合并后的文件继续列出所有重复的案例,例如:

ID Date X  Y
1  3    4  .
1  5    3  .
1  6    4  2
1  7    1  5
2  1    4  .
2  8    4  7
3  7    2  3

然后我计划重组 (CASESTOVARS /AUTOFIX=0) 合并的文件,使其看起来像这样:

ID Date.1 Date.2 Date.3 Date.4  X.1  X.2  X.3  X.4  Y.1  Y.2  Y.3  Y.4
1  3      5      6      7       4    3    4    1    .    .    2    5
2  1      8      .      .       4    4    .    .    .    7    .    .
3  7      .      .      .       2    .    .    .    3    .    .    .

但是,我在初始合并过程中遇到了问题。当它们都有重复的情况时,我尝试寻找最安全的合并文件的方法,以确保在此过程中不会丢失任何数据。似乎“添加变量”方法会导致重复变量的值丢失。

谢谢!

编辑:如果我使用“添加变量”功能并同时使用 IDDate 变量作为关键变量,是否有助于避免删除重复案例?

【问题讨论】:

    标签: merge duplicates spss


    【解决方案1】:

    为什么不试试add cases 而不是add variables?如果没有出现具有相同日期的相同 ID,则它应该可以与 casestovars 一起使用。

    如果存在此类情况,您需要先考虑如何处理它们,然后才能继续使用casestovars
    一种方法是按 ID 和 DATE 聚合并决定是否要例如将本案例的数据变量加起来。

    【讨论】:

    • 我会试试的。如果存在“未配对”变量(例如,将旧数据集添加到具有新变量的新数据集时),如果我将它们移到活动数据集中,它们是否会在合并数据集中的旧案例中被标记为“缺失”?
    • 好的,所以使用“添加案例”命令对子文件效果很好。当我尝试重组/转置时,我遇到了一些问题。每次访问实际上有三个标识符:“ID”(每个人); '日期';和“Recrdnum”(记录该特定访问的编号,如果同一个人在同一日期多次访问,则将有所不同)。应该如何将这些输入到重组语法中以相应地转置('CASESTOVARS')数据?
    • casestovars 中可以有多个索引变量。但我认为您的重组问题需要更多详细说明,因此可能会在单独的问题中关注它。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-02-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多