【发布时间】:2016-07-30 05:06:02
【问题描述】:
我对生存分析很陌生,所以我的问题对你们大多数人来说可能很幼稚,我很抱歉。
我有一些左右删失的遥测数据。
我首先必须估计 3 个虚拟解释变量对生存的影响,因此我使用了 Anderson-Gill 模型(Cox 模型的扩展)。在这里,危害是性别、研究区域(地区)和年龄等级(年龄分为 3 个年龄等级:小猫(0-1 岁)、一岁(1-2 岁)和成人(2 岁以上))的函数。主要的“问题”是年龄类变量是一个时间相关的协变量。一些人在几年内被跟踪,因此在研究期间改变了年龄等级。该模型的输出提供了我正在测试的每个变量对生存(性别、地区和年龄类别)的影响。我可以使用survfit() 轻松预测生存率 (S(t)),并且预测的曲线代表了协变量对应于 newdata 中的值的群组。
我的最终目标是估计每个队列的平均年存活率(即来自北部地区的成年男性),以便将这些估计值用作年龄结构矩阵人口模型的输入。我最初想对从survfit() 函数得到的生存估计 S(t) 进行简单的平均,但后来我意识到时间相关的协变量似乎使估计更加复杂。我什至想知道是否可以使用 Cox 模型估计每个队列的平均年生存率。也许每年的 Kaplan-Meier 生存估计应该可以解决问题?是否可以从survfit()获取?
是否已经有人必须进行相同类型的分析? 以下是总结我为估计每个协变量的影响所做的 R 代码:
#create a surv object in order to adjust a Cox model on dataset
mydata.surv <- Surv(mydata$START,mydata$END, mydata$STATE)
# Andersen-Gill model
fit <- cph(formula = mydata.surv~SEX+AGE_CLASS+STUDYAREA, data=mydata,
method=c("exact"), se.fit=T, linear.predictors=TRUE,
x=T, y=T, surv="summary")
#create new dataset in order to predict survival
newdata <- expand.grid(AGE_CLASS=c(1,2,3),SEX=c("M","F"),
STUDYAREA=c("north","mid","south"))
#predict survival for each cohorts
out <- summary(survfit(fit, newdata = newdata , type = "breslow"))
【问题讨论】:
标签: r mean rate survival-analysis cox-regression