【发布时间】:2019-04-18 14:18:44
【问题描述】:
探索新的大型 SAS 数据集。许多年前,我有一个解决方案,它对数据集中的所有数字或所有字符变量执行 proc freq。
但为了简单起见,它只保留最常见的类别(用户指定)并将其余类别(或响应值)合并为一个大类别。
【问题讨论】:
-
是否要将 proc freq 的输出创建到另一个数据集中,条件是仅生成用户指定的响应?
-
举个例子,如果我对一个 var 有十个类别的响应,我将调用 var1。现在我正在处理数百万条记录,但我也不知道 var1 有十个类别。以某种方式让 proc freq 工作但包含一个指定我的组的最大大小的参数会很好。所以输出可能是 var1: A 20 B 15 C 10 All other 40 在这个例子中,我说要对所有类别超过 10 或更多的类别执行 proc freq,其他所有内容都被“修改”到最后一个所有其他类别。这样做的诀窍是基本上为所有人做。
标签: sas