【问题标题】:yearly survival rates with cox model [R]cox 模型的年生存率 [R]
【发布时间】:2016-07-30 05:06:02
【问题描述】:

我对生存分析很陌生,所以我的问题对你们大多数人来说可能很幼稚,我很抱歉。

我有一些左右删失的遥测数据。

我首先必须估计 3 个虚拟解释变量对生存的影响,因此我使用了 Anderson-Gill 模型(Cox 模型的扩展)。在这里,危害是性别、研究区域(地区)和年龄等级(年龄分为 3 个年龄等级:小猫(0-1 岁)、一岁(1-2 岁)和成人(2 岁以上))的函数。主要的“问题”是年龄类变量是一个时间相关的协变量。一些人在几年内被跟踪,因此在研究期间改变了年龄等级。该模型的输出提供了我正在测试的每个变量对生存(性别、地区和年龄类别)的影响。我可以使用survfit() 轻松预测生存率 (S(t)),并且预测的曲线代表了协变量对应于 newdata 中的值的群组。

我的最终目标是估计每个队列的平均年存活率(即来自北部地区的成年男性),以便将这些估计值用作年龄结构矩阵人口模型的输入。我最初想对从survfit() 函数得到的生存估计 S(t) 进行简单的平均,但后来我意识到时间相关的协变量似乎使估计更加复杂。我什至想知道是否可以使用 Cox 模型估计每个队列的平均年生存率。也许每年的 Kaplan-Meier 生存估计应该可以解决问题?是否可以从survfit()获取?

是否已经有人必须进行相同类型的分析? 以下是总结我为估计每个协变量的影响所做的 R 代码:

 #create a surv object in order to adjust a Cox model on dataset
mydata.surv <- Surv(mydata$START,mydata$END, mydata$STATE) 

 # Andersen-Gill model
fit <- cph(formula = mydata.surv~SEX+AGE_CLASS+STUDYAREA, data=mydata, 
           method=c("exact"), se.fit=T, linear.predictors=TRUE,  
           x=T, y=T, surv="summary")

 #create new dataset in order to predict survival
newdata <- expand.grid(AGE_CLASS=c(1,2,3),SEX=c("M","F"),
                   STUDYAREA=c("north","mid","south"))  

 #predict survival for each cohorts
out <- summary(survfit(fit, newdata = newdata , type = "breslow")) 

【问题讨论】:

    标签: r mean rate survival-analysis cox-regression


    【解决方案1】:

    我认为这个问题可能应该交给 Cross-Validated。但这是我的看法:您应该使用逻辑回归模型。一旦受试者存活了一定时间,他们就不会被审查,但你观察到失败,他们会在新的年龄重新进入队列。它们不是独立的,除非生存过程是有条件的无记忆的(一个复杂的鞅属性,与统计无关,因为它是一个不可能测试的假设)。您可以通过观察每个受试者的特定生存间隔来构建独立样本。将这些结果与将每个受试者特定年龄间隔视为独立数据的伪似然进行比较,然后检查随机效应模型并验证随机截距的方差与固定效应的 95% CI 相比相对较小。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-11-10
      • 2018-02-17
      • 2016-03-02
      • 2020-05-17
      • 1970-01-01
      相关资源
      最近更新 更多