【发布时间】:2019-03-31 08:50:32
【问题描述】:
我有一个关于 SAS 的问题。您通常如何确定两个数据集的差异?下面是我使用的代码。这就是我用来确定记录是否在一个数据集中但不在另一个数据集中的方法。例如,如果运行代码的人获得更高或更低的记录数。我正在寻找任何替代方案。谢谢。
PROC SORT DATA=IVT.REQ_1_3_17 OUT=lob.REQ_1_3_17i;
BY ACCT_NB DAY_TIME_DIM_NB TXN_AM TXN_POSTING_SEQ CS_TXN_CD REQ_1_3_EXCL;
RUN;
PROC SORT DATA=lob.REQ_1_3_17 OUT=lob.REQ_1_3_17l;
BY ACCT_NB DAY_TIME_DIM_NB TXN_AM TXN_POSTING_SEQ CS_TXN_CD REQ_1_3_EXCL;
RUN;
DATA lob.MISMATCHES_1;
MERGE lob.REQ_1_3_17i(IN =A) lob.REQ_1_3_17l(IN=B);
BY ACCT_NB DAY_TIME_DIM_NB TXN_AM TXN_POSTING_SEQ CS_TXN_CD REQ_1_3_EXCL;
IF A AND NOT B;
RUN;
【问题讨论】:
-
PROC COMPARE 是您的起点。有关该主题的论文,请参阅来自 @user667489 的链接。