【发布时间】:2019-04-11 14:05:58
【问题描述】:
我正在使用 randomForestSRC 来估计 34 个潜在生存预测因子的变量重要性。当所有潜在的预测变量都是数字(或编码为数字)时,程序包运行没有问题。当我添加/适当地将因子变量编码为因子时,我收到以下错误:
Error in Math.factor(cens) : ‘floor’ not meaningful for factors.
我已经尝试使用包默认值来确保我指定的任何内容都不会导致问题。我尝试将所有变量编码为数字 - 这是不正确的。这消除了问题。我不知道为什么将舍入、下限应用于因子变量。我查看了包中运行的代码,无法确定问题出在哪里。
从Stata导出的csv文件中读取数据集
returners<-read.csv("2019April11_RSF.csv")
用 1000 棵树种植随机生存森林,指明时间和结果变量
rsfr.obj <- rfsrc(Surv(days_return_or_censor, returner_SC) ~ ., returners,
ntree = 1000)
打印并绘制成长对象
print(rsfr.obj)
我希望打印出错误率和变量重要性估计值。相反,我得到了错误:
Error in Math.factor(cens) : ‘floor’ not meaningful for factors
【问题讨论】:
-
您是否尝试通过minimal reproducible example 联系包维护者?
标签: r