【发布时间】:2016-07-14 08:21:21
【问题描述】:
我目前在 SAS 中遇到问题。我正在写关于职业伤害和此类事故造成的工资损失的硕士论文。我拥有一个数据集,其中包含给定人口的月工资信息。该数据集包含每个人的特定标识符以及一系列背景信息,如教育、性别等。如果个人收到了特定月份的工资支付,他或她就在我的数据集中,该特定月份具有上述-提到的信息。如果此人未收到特定月份的工资支付(例如,由于失业、假期、疾病等),则该人在该特定月份的数据集中找不到 - 即使此人可能已收到工资支付前一个月和后一个月。因此,例如,一个工作了一整年的人在数据集中有 12 个观察值。如果某人由于某种原因没有工作 2 个月,则该人只有 10 次观察。
如果我不处理这个问题,我的估计很可能会出现正偏差。一个人可能在给定月份遭受工伤,然后在下个月返回,该人因病缺勤的月份应构成工资支付为零,但仍包含“背景”信息。
我已经上传了一个数据集的例子,可以在这里找到:
https://www.dropbox.com/s/0zkr0430menotdf/Data.xlsx?dl=0
数据包含三个人 (1,2,3) 的工资信息、教育组、性别。标识符为 2 的人在第 8 个月没有收到付款,因此该月没有任何观察结果。
我不知道如何制作一个 SAS 程序来为那个人填写信息。我想对第 8 个月的人 2 进行新的观察,工资支付为零,但上个月其他变量的信息滞后。在我的原始数据集中,我有数千人,其中一些潜力可能有多个不存在的工资信息。
【问题讨论】:
标签: sas missing-data