【发布时间】:2013-05-20 20:04:39
【问题描述】:
我们正在尝试在 R 中重现加速失效时间 (aft) 模型的结果,该模型已在 SAS 中编码。
我们使用的数据集是here
您也可以在此处找到 SAS 代码。
formula <- survreg(Surv(Duration, Censor) ~ Acq_Expense + Acq_Expense_SQ + Ret_Expense + Ret_Expense_SQ + Crossbuy + Frequency + Frequency_SQ + Industry + Revenue + Employees, dist='weibull', data = daten [daten$Acquisition==1, ])
out1 <- survreg(formula = formula, data = daten [daten$Acquisition==1, ], dist = "weibull")
summary(out1)
ind <- c("Duration", "Censor")
err.mat <- ???
out2 <- simexaft(formula = formula, data = daten [daten$Acquisition==1, ], SIMEXvariable = ind, repeated = FALSE, err.mat = err.mat, dist = "weibull")
summary(out2)
我们的问题是如何定义 err.mat 术语? err.mat 指定具有测量误差的变量。由于我们的数据集是正确删失的,我认为具有测量误差的变量可能是 Duration 和/或 Censor。但并不是这么简单,err.mat 必须是一个对称的平方数字矩阵。
【问题讨论】:
-
您提供的链接,指向整本书。你能说说是哪一章吗?
-
好点。带来不便敬请谅解。我说的是第 3 章 - 客户获取。
标签: r survival-analysis