SPSS - 合并具有ID变量重复案例和新案例/变量的文件答案

【问题标题】：SPSS - merging files with duplicate cases of ID variable and new cases/variablesSPSS - 合并具有ID变量重复案例和新案例/变量的文件
【发布时间】：2017-02-20 19:02:53
【问题描述】：

我有一个用于多年商店访问的管理数据集，我试图将其合并到 ID 变量下。

每个数据集都有一个 ID 的重复项，这些重复项出现在不同的商店访问期间，由 Date 注释。一些较新的数据文件还包含旧数据文件中未包含的新变量 (Y)。来自不同年份的数据集也将包含不同ID 表示的不同案例。此外，某些变量对于每种情况可能是相同的，但在不同的日期。我希望合并后的文件保留这些重复项。

示例数据文件：

文件 1

文件 2

ID Date X  Y
1  6    4  2
1  7    1  5
2  8    4  7
3  7    2  3

我希望合并后的文件继续列出所有重复的案例，例如：

ID Date X  Y
1  3    4  .
1  5    3  .
1  6    4  2
1  7    1  5
2  1    4  .
2  8    4  7
3  7    2  3

然后我计划重组 (CASESTOVARS /AUTOFIX=0) 合并的文件，使其看起来像这样：

ID Date.1 Date.2 Date.3 Date.4  X.1  X.2  X.3  X.4  Y.1  Y.2  Y.3  Y.4
1  3      5      6      7       4    3    4    1    .    .    2    5
2  1      8      .      .       4    4    .    .    .    7    .    .
3  7      .      .      .       2    .    .    .    3    .    .    .

但是，我在初始合并过程中遇到了问题。当它们都有重复的情况时，我尝试寻找最安全的合并文件的方法，以确保在此过程中不会丢失任何数据。似乎“添加变量”方法会导致重复变量的值丢失。

谢谢！

编辑：如果我使用“添加变量”功能并同时使用 ID 和 Date 变量作为关键变量，是否有助于避免删除重复案例？

【问题讨论】：

标签： merge duplicates spss

【解决方案1】：

为什么不试试add cases 而不是add variables？如果没有出现具有相同日期的相同 ID，则它应该可以与 casestovars 一起使用。

如果存在此类情况，您需要先考虑如何处理它们，然后才能继续使用casestovars。
一种方法是按 ID 和 DATE 聚合并决定是否要例如将本案例的数据变量加起来。

【讨论】：

我会试试的。如果存在“未配对”变量（例如，将旧数据集添加到具有新变量的新数据集时），如果我将它们移到活动数据集中，它们是否会在合并数据集中的旧案例中被标记为“缺失”？
好的，所以使用“添加案例”命令对子文件效果很好。当我尝试重组/转置时，我遇到了一些问题。每次访问实际上有三个标识符：“ID”（每个人）； '日期';和“Recrdnum”（记录该特定访问的编号，如果同一个人在同一日期多次访问，则将有所不同）。应该如何将这些输入到重组语法中以相应地转置（'CASESTOVARS'）数据？
casestovars 中可以有多个索引变量。但我认为您的重组问题需要更多详细说明，因此可能会在单独的问题中关注它。