【问题标题】:Variable number of arguments in r decision treer 决策树中可变数量的参数
【发布时间】:2015-06-23 17:49:46
【问题描述】:

感谢您的帮助 - 我正在 R 中构建决策树,经典示例是

iris_ctree

我的问题是:如果我想输入可变数量的参数,而不是预先指定 Sepal.Length + Sepal.Width 和 Petal.Length,该怎么办?

Flowervar1、Flowervar2、Flowervar3 等。如果在程序运行之前我不知道自变量的数量,我该如何将其传递到公式中?

【问题讨论】:

  • 您如何“知道”您想要包含哪些变量?如果你有一个更具体的reproducible example 会有所帮助
  • 所以在这种情况下,我有数百个可能的自变量,我想为用户提供选择要包含多少个变量的机会——如果以花为例,有有 40 种可能的测量值,您可以在运行时选择在制作树时使用多少。这有帮助吗?
  • 你将如何在运行时使用 R 与用户交互?您打算传递给建模函数的输入是什么?
  • 情况的细节是:我正在尝试将文本文件分类为两个类别之一。我有几个指标来挑选“最佳”词来对文档进行分类,其中一个规范是用户应该能够指定有多少最热门的词用于分类。因此,我不能真正将许多自变量硬编码到决策树中,我必须使用指定的数字。
  • 我认为公式实际上并没有要求我将列与“自变量 1 + 自变量 2 + ...”相加,对吗?

标签: r machine-learning decision-tree


【解决方案1】:

根据 MrFlick 的优秀推荐,我找到了!

listofintfactors <- c(paste("df", 1:iterations-1, sep = ""))

form <- as.formula(paste("df[,ncol(df)]~", paste (listofintfactors[-1], collapse="+")))

得到了我需要的确切公式,然后我就可以将其插入决策树,嘿,它很快就消失了。 “迭代”是我正在测试的变量的数量,所以这现在适用于任何用户输入的数字。

所以:谢谢,弗利克先生!

【讨论】:

    猜你喜欢
    • 2014-04-22
    • 2015-07-31
    • 2016-05-18
    • 2014-08-21
    • 2023-03-15
    • 2014-06-15
    • 2020-06-05
    • 2021-05-30
    • 2012-12-14
    相关资源
    最近更新 更多