【问题标题】:Getting Summary Data for Longitudinal Data in R在 R 中获取纵向数据的汇总数据
【发布时间】:2024-01-08 15:05:01
【问题描述】:

我有一组纵向数据,是数年不定期随访的一些患者,因保密问题无法发布,

基本上,每一行代表一个患者就诊,包括入院日期、出院日期、患者标识符和各种人口统计(例如种族)和其他变量,

例如:

Patient Admission Date Ethnicity
1 26-01-2007 White
1 28-08-2008 White
2 12-02-2001 Black
2 01-12-2015 Black
2 03-12-2018 Black

我尝试使用各种软件包,例如 brolgar 和 tsibble,但无法获得简单的汇总统计数据,例如个体患者数量、每位患者的就诊次数、每个种族类别中每位患者从第一次到最后一次就诊的时间(这一个人可能值得另一个问题,因为它可能要困难得多)例如,

在标准数据集中,您可以使用 dplyr 执行以下操作:

    df %>%
    group_by(Ethnicity) %>%
    summarise(n=n)

统计每组的患者人数,

但我不知道如何为这个数据集做这件事,尽管我已经通过了像 brolgar/tsibble 这样的包,

如果有任何建议,将不胜感激

非常感谢

【问题讨论】:

  • 每位患者的就诊次数为:df %>% group_by(Patient) %>% summarise(n=n())

标签: r panel-data longitudinal


【解决方案1】:

我已经做到了:

df <- data.frame("Patient" = c(rep(1, 2), rep(2, 3)),
             "Admission Date" = c("26-01-2007", "28-08-2008", "12-02-2001", "01-12-2015", "03-12-2018"),
             "Ethnicity" = c(rep("White", 2), rep("Black", 3)),
             stringsAsFactors = FALSE)

individual_patient <- n_distinct(df$Patient)
df2 <- df %>% group_by(Patient) %>% summarise(Encounter_number = n())

它们是你需要计算的其他东西吗?

【讨论】: