【问题标题】:feature selection function in caret packagecaret 包中的特征选择函数
【发布时间】:2018-05-03 13:45:11
【问题描述】:

我发布这个是因为这个帖子feture selection in caret 已经解决了我的问题,并且我有 2 个关于插入符号包中的功能选择功能的问题

当我在我的基因表达矩阵allsamplecombat 上运行下面的代码时,y= 中定义了 5 个类:

control <- rfeControl(functions=rfFuncs, method="cv", number=10) results <- rfe(t(allsamplecombat[filter,]), y = factor(info$clust), sizes=c(300,400,500,600,700,800,1000,1200), rfeControl=control) 我得到了这样的输出

所以,我想知道我是否可以为每个类提取顶级特征,因为predictors(results) 只是给我结果特征,而没有指出每个类的重要性。

我的第二个问题是,当我尝试将 rfeControl functions 更改为 treebagFuncs 并运行 'parRF` 方法时

control <- rfeControl(functions=treebagFuncs, method="cv", number=5) results <- rfe(t(allsamplecombat[filter,]), y = factor(info$clust), sizes=c(400,500,600,700,800), rfeControl=control, method="parRF") 我收到Error in { : task 1 failed - "subscript out of bounds" 错误。

我的代码有什么问题?

【问题讨论】:

    标签: r classification r-caret


    【解决方案1】:

    对于重要性,有一个名为variables 的子对象,其中包含每个消除步骤的信息。

    treebagFuncs 旨在与ipredbagging 函数一起使用,并且与随机森林无关。

    您可能会使用caretFuncs 并将method 传递给它。 但是,如果您要并行化某些东西,请对重采样循环而不是模型函数执行此操作。这通常更有效。请注意,如果您同时使用 M 工人,您实际上可能会得到M^3(一个用于rfe,一个用于train,一个用于parRF)。 rfetrain 中有选项可以关闭它们的并行性。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-11-24
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-02-12
      • 2012-09-29
      • 2020-10-07
      相关资源
      最近更新 更多