【发布时间】:2015-07-21 08:36:16
【问题描述】:
我认为rpart 和tree 完全相同,直到我遇到这个问题。
我有一个包含 329 列的数据框 wikiWords。其中 328 个在预测变量,它们都是 num。左边是Vandal - 响应是factor。 str(wikiWords) 是:
'data.frame': 3876 obs. of 329 variables:
$ A accord : num 0 0 0 0 0 0 0 0 0 0 ...
$ A actual : num 0 0 0 0 0 0 0 0 0 0 ...
$ A ago : num 0 0 0 0 0 0 0 0 0 0 ...
$ A agre : num 0 0 0 0 0 0 0 0 0 0 ...
$ A analog : num 0 0 0 0 0 0 0 0 0 0 ...
$ A appar : num 0 0 0 0 0 0 0 0 0 0 ...
$ A arbitrari : num 0 0 0 0 0 0 0 0 0 0 ...
$ A believ : num 0 0 0 0 0 0 0 0 0 0 ...
$ A biolog : num 0 0 0 0 0 0 0 0 0 0 ...
$ A biologyanalog : num 0 0 0 0 0 0 0 0 0 0 ...
$ A bodi : num 1 0 0 0 1 0 0 0 0 0 ...
$ A call : num 1 0 0 0 1 0 0 0 0 0 ...
......
$ Vandal : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
这很好用:
wikitree = rpart(Vandal ~ .,data=wikiWords,method = 'class')
但这显示了一个错误:
wikitree = tree(Vandal ~ .,data=wikiWords,method = 'class')
错误是:“[.data.frame(frame, predictors) 中的错误:选择了未定义的列”
我真的不知道出了什么问题。非常感谢任何帮助。
【问题讨论】:
-
你能提供
str(wikiWords)吗?我用模拟数据尝试了代码,一切都很好,所以我想可能是非标准列名有问题?但如果不了解您的数据,那纯属猜测。 -
@thothal:已添加。
标签: r