【发布时间】:2015-06-23 17:49:46
【问题描述】:
感谢您的帮助 - 我正在 R 中构建决策树,经典示例是
iris_ctree
我的问题是:如果我想输入可变数量的参数,而不是预先指定 Sepal.Length + Sepal.Width 和 Petal.Length,该怎么办?
Flowervar1、Flowervar2、Flowervar3 等。如果在程序运行之前我不知道自变量的数量,我该如何将其传递到公式中?
【问题讨论】:
-
您如何“知道”您想要包含哪些变量?如果你有一个更具体的reproducible example 会有所帮助
-
所以在这种情况下,我有数百个可能的自变量,我想为用户提供选择要包含多少个变量的机会——如果以花为例,有有 40 种可能的测量值,您可以在运行时选择在制作树时使用多少。这有帮助吗?
-
你将如何在运行时使用 R 与用户交互?您打算传递给建模函数的输入是什么?
-
情况的细节是:我正在尝试将文本文件分类为两个类别之一。我有几个指标来挑选“最佳”词来对文档进行分类,其中一个规范是用户应该能够指定有多少最热门的词用于分类。因此,我不能真正将许多自变量硬编码到决策树中,我必须使用指定的数字。
-
我认为公式实际上并没有要求我将列与“自变量 1 + 自变量 2 + ...”相加,对吗?
标签: r machine-learning decision-tree