【发布时间】:2017-02-20 19:02:53
【问题描述】:
我有一个用于多年商店访问的管理数据集,我试图将其合并到 ID 变量下。
每个数据集都有一个 ID 的重复项,这些重复项出现在不同的商店访问期间,由 Date 注释。一些较新的数据文件还包含旧数据文件中未包含的新变量 (Y)。来自不同年份的数据集也将包含不同ID 表示的不同案例。此外,某些变量对于每种情况可能是相同的,但在不同的日期。我希望合并后的文件保留这些重复项。
示例数据文件:
文件 1
ID Date X
1 3 4
1 5 3
2 1 4
文件 2
ID Date X Y
1 6 4 2
1 7 1 5
2 8 4 7
3 7 2 3
我希望合并后的文件继续列出所有重复的案例,例如:
ID Date X Y
1 3 4 .
1 5 3 .
1 6 4 2
1 7 1 5
2 1 4 .
2 8 4 7
3 7 2 3
然后我计划重组 (CASESTOVARS /AUTOFIX=0) 合并的文件,使其看起来像这样:
ID Date.1 Date.2 Date.3 Date.4 X.1 X.2 X.3 X.4 Y.1 Y.2 Y.3 Y.4
1 3 5 6 7 4 3 4 1 . . 2 5
2 1 8 . . 4 4 . . . 7 . .
3 7 . . . 2 . . . 3 . . .
但是,我在初始合并过程中遇到了问题。当它们都有重复的情况时,我尝试寻找最安全的合并文件的方法,以确保在此过程中不会丢失任何数据。似乎“添加变量”方法会导致重复变量的值丢失。
谢谢!
编辑:如果我使用“添加变量”功能并同时使用 ID 和 Date 变量作为关键变量,是否有助于避免删除重复案例?
【问题讨论】:
标签: merge duplicates spss