【发布时间】:2017-11-10 14:21:02
【问题描述】:
我建立了一个预测模型,将人分为收入 50k 的两类
但是当我在 excel 或 r 中打开我的文件以查看最终预测时,我看到的只是我为简化过程而首先分配的级别(1 和 2)来代替我的值
请告诉我如何保留由级别而不是级别表示的原始值
这是我遵循的大纲
这是我的目标变量income.group 这里是初始状态
str (train_gbW7HTd $Income.Group)
chr [1:32561] "
现在应用决策树,我将目标变量编码为级别 1 和 2 我使用了以下代码 train$Income.Group
table(train$Income.Group)
1 2
24720 7841
我像这样构建决策树 set.seed(333)
fit
做出预测 pred
pred_train
confusionMatrix (pred_train,train$Income.Group)
保存了我的文件 solution.frame
write.csv(solution.frame,file = "final_solution.csv")
但我的最终 csv 文件具有代表最终预测的 1 级和 2 级,而不是我真正想要的 50k。 请告诉我如何进行。 提前致谢 我已经用过 solution.frame$Income.Group 50k")
但它为 Income.Group 的整个列提供了 >50k 的单个值
请告诉我该怎么做,因为我卡在这一步,无法完成我的模型提交。
【问题讨论】: