【发布时间】:2013-07-02 19:19:14
【问题描述】:
我想创建一个表格,列出每个变量频率的频率。例如,一个包含 100 行和 4 个变量的数据集:ID、A、B 和 C。
我正在寻找的是这样的:
Freqs| ID A B C
----------------------------
1 | 100 20 15 10
2 | 0 40 35 0
3 | 0 0 5 30
由于有 100 个唯一 ID,因此原始数据中 1 的频率将有 100 个。
编辑澄清: 如果您对原始数据执行 proc freq,则每个 ID 的频率将为 1。然后,如果您对计数执行 proc freq,则计数为 1 的频率为 100。我正在为数据集中的每个变量寻找它。
【问题讨论】:
-
不确定在多个地方使用“频率”是什么意思。听起来像是某种 proc freq 或 proc tabulate。 “频率”是什么意思? Freqs=1 是只出现一次的唯一值的数量,Freqs=2 是出现两次的唯一值的数量,等等?
-
如果您对原始数据执行 proc freq,则每个 ID 的频率将为 1。然后,如果您对计数执行 proc freq,则计数为 1 的频率为 100。我正在为数据集中的每个变量寻找它。
-
很好的说明。我会把它编辑成问题,甚至提出这个问题 - 这是一个比你原来的问题更清晰的问题:)