【发布时间】:2017-01-11 13:05:36
【问题描述】:
如何使用 R 中 randomForrest 调用的结果来预测一些未标记数据(例如要分类的真实世界输入)上的标签?
代码:
train_data = read.csv("train.csv")
input_data = read.csv("input.csv")
result_forest = randomForest(Label ~ ., data=train_data)
labeled_input = result_forest.predict(input_data) # I need something like this
train.csv:
a;b;c;label;
1;1;1;a;
2;2;2;b;
1;2;1;c;
输入.csv:
a;b;c;
1;1;1;
2;1;2;
我需要这样的东西
a;b;c;label;
1;1;1;a;
2;1;2;b;
【问题讨论】:
-
predict(result_forest, newdata=input_data). -
@eipi10,非常感谢。那是我使用 R 的第一天。您可以将您的评论重写为答案,让我接受它
-
Stack Overflow 上有很多与
predict相关的问题,所以我猜这个问题可能是重复的。不需要我添加答案。要记住以备将来参考的关键是,几乎每个建模函数都是 R 有一个predict“方法”,这意味着如果您在模型对象上运行predict,它将默认返回训练数据的预测,如果您使用newdata参数,则可以预测新数据。
标签: r machine-learning random-forest