【问题标题】:SAS Proc Freq For All Variables - But Collapsing Extra Categories所有变量的 SAS Proc Freq - 但折叠额外类别
【发布时间】:2019-04-18 14:18:44
【问题描述】:

探索新的大型 SAS 数据集。许多年前,我有一个解决方案,它对数据集中的所有数字或所有字符变量执行 proc freq。

但为了简单起见,它只保留最常见的类别(用户指定)并将其余类别(或响应值)合并为一个大类别。

【问题讨论】:

  • 是否要将 proc freq 的输出创建到另一个数据集中,条件是仅生成用户指定的响应?
  • 举个例子,如果我对一个 var 有十个类别的响应,我将调用 var1。现在我正在处理数百万条记录,但我也不知道 var1 有十个类别。以某种方式让 proc freq 工作但包含一个指定我的组的最大大小的参数会很好。所以输出可能是 var1: A 20 B 15 C 10 All other 40 在这个例子中,我说要对所有类别超过 10 或更多的类别执行 proc freq,其他所有内容都被“修改”到最后一个所有其他类别。这样做的诀窍是基本上为所有人做。

标签: sas


【解决方案1】:

据我所知,没有默认设置,但编写一个代码并不难。

通常,您可以使用_numeric__character_ 来引用变量列表来执行此操作。

   proc freq data=have;
   table _numeric_ ; *all numeric variables;
   table _character_; *all character variables;
   table _all_; *all variables;
   run;

   *all variables;
   proc freq data=have;
   run;

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-01-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-04-07
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多