【发布时间】:2014-09-22 17:46:09
【问题描述】:
我有一个包含许多变量的数据集。感兴趣的是:ID、情节、开始、结束、评估日期。显示了一个示例数据集
ID Episode Start End AssessmentDate
1 1 1/1/2012 12/21/2012 1/1/2012
1 1 1/1/2010 12/21/2012 12/12/2012
1 1 1/1/2010 12/21/2012 12/21/2012
1 2 1/1/2013 . 1/2/2013
1 2 1/1/2013 . 2/2/2013
1 2 1/1/2013 . 3/2/2013
2 1 1/1/2012 . 4/1/2012
2 1 1/1/2010 . 5/12/2012
2 1 1/1/2010 . 6/21/2012
2 2 1/1/2013 . 7/2/2013
2 2 1/1/2013 . 8/2/2013
2 2 1/1/2013 . 9/2/2013
我有每个人的开始日期,但没有任何结束日期。我想为 10,000 名患者确定每一集和每位患者的结束日期。我希望结束日期是每个剧集编号的最后评估日期,并且我希望在第一个和最后一个评估日期之间的每一行中都存在此日期。
我正在阅读一些关于根据 ID 和 Episode 将数据集拆分为许多较小部分的内容,但我觉得应该有一种更简单的方法来做到这一点。我是来自 SAS 的 R 新手,SAS 中的此类问题不会给我带来太多麻烦。
如果您对我的数据准备工作提出任何意见,我将不胜感激。
【问题讨论】:
-
我同意。您可能希望将示例数据更改为更能代表您的实际数据的内容