【发布时间】:2024-01-08 15:05:01
【问题描述】:
我有一组纵向数据,是数年不定期随访的一些患者,因保密问题无法发布,
基本上,每一行代表一个患者就诊,包括入院日期、出院日期、患者标识符和各种人口统计(例如种族)和其他变量,
例如:
| Patient | Admission Date | Ethnicity |
|---|---|---|
| 1 | 26-01-2007 | White |
| 1 | 28-08-2008 | White |
| 2 | 12-02-2001 | Black |
| 2 | 01-12-2015 | Black |
| 2 | 03-12-2018 | Black |
我尝试使用各种软件包,例如 brolgar 和 tsibble,但无法获得简单的汇总统计数据,例如个体患者数量、每位患者的就诊次数、每个种族类别中每位患者从第一次到最后一次就诊的时间(这一个人可能值得另一个问题,因为它可能要困难得多)例如,
在标准数据集中,您可以使用 dplyr 执行以下操作:
df %>%
group_by(Ethnicity) %>%
summarise(n=n)
统计每组的患者人数,
但我不知道如何为这个数据集做这件事,尽管我已经通过了像 brolgar/tsibble 这样的包,
如果有任何建议,将不胜感激
非常感谢
【问题讨论】:
-
每位患者的就诊次数为:df %>% group_by(Patient) %>% summarise(n=n())
标签: r panel-data longitudinal