【问题标题】:Survival analysis: aft model, simexaft package in R生存分析:Aft 模型,R 中的 simexaft 包
【发布时间】:2013-05-20 20:04:39
【问题描述】:

我们正在尝试在 R 中重现加速失效时间 (aft) 模型的结果,该模型已在 SAS 中编码。

我们使用的数据集是here

您也可以在此处找到 SAS 代码。

    formula <- survreg(Surv(Duration, Censor) ~ Acq_Expense + Acq_Expense_SQ + Ret_Expense + Ret_Expense_SQ + Crossbuy + Frequency + Frequency_SQ + Industry + Revenue + Employees, dist='weibull', data = daten [daten$Acquisition==1, ])
    out1 <- survreg(formula = formula, data = daten [daten$Acquisition==1, ], dist = "weibull")
    summary(out1)

    ind <- c("Duration", "Censor")

    err.mat <- ???

    out2 <- simexaft(formula = formula, data = daten [daten$Acquisition==1, ], SIMEXvariable = ind, repeated = FALSE, err.mat = err.mat, dist = "weibull")
    summary(out2)

我们的问题是如何定义 err.mat 术语? err.mat 指定具有测量误差的变量。由于我们的数据集是正确删失的,我认为具有测量误差的变量可能是 Duration 和/或 Censor。但并不是这么简单,err.mat 必须是一个对称的平方数字矩阵。

【问题讨论】:

  • 您提供的链接,指向整本书。你能说说是哪一章吗?
  • 好点。带来不便敬请谅解。我说的是第 3 章 - 客户获取。

标签: r survival-analysis


【解决方案1】:

如果您阅读Journal of Statistical Software,January 2012, Volume 46, article describing the simexaft package,很明显在没有重复测量的情况下从数据中估计测量误差,您必须自己根据领域知识提供这些估计。请参见第 6-8 页中的示例。另请参阅引用的"Statistics in Medicine" article available at Dr Yi's website。在该示例中,测量误差是前两个预测变量,收缩压 (SBP) 和血清胆固醇 (CHOL)。如果您使用的是从中提取数据的文本,那么您需要阅读章节文本(该网站上似乎没有该文本)以确定他们对测量误差做出的假设。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-04
    • 2016-12-11
    • 1970-01-01
    • 1970-01-01
    • 2016-07-30
    相关资源
    最近更新 更多