【问题标题】:convert factor levels back into original character values将因子级别转换回原始字符值
【发布时间】:2017-11-10 14:21:02
【问题描述】:

我建立了一个预测模型,将人分为收入 50k 的两类

但是当我在 excel 或 r 中打开我的文件以查看最终预测时,我看到的只是我为简化过程而首先分配的级别(1 和 2)来代替我的值

请告诉我如何保留由级别而不是级别表示的原始值

这是我遵循的大纲

这是我的目标变量income.group 这里是初始状态

str (train_gbW7HTd $Income.Group)

chr [1:32561] "

现在应用决策树,我将目标变量编码为级别 1 和 2 我使用了以下代码 train$Income.Group

table(train$Income.Group)

1     2 

24720 7841

我像这样构建决策树 set.seed(333)

fit

做出预测 pred

pred_train

confusionMatrix (pred_train,train$Income.Group)

保存了我的文件 solution.frame

write.csv(solution.frame,file = "final_solution.csv")

但我的最终 csv 文件具有代表最终预测的 1 级和 2 级,而不是我真正想要的 50k。 请告诉我如何进行。 提前致谢 我已经用过 solution.frame$Income.Group 50k")

但它为 Income.Group 的整个列提供了 >50k 的单个值

请告诉我该怎么做,因为我卡在这一步,无法完成我的模型提交。

【问题讨论】:

    标签: r model


    【解决方案1】:

    你可以使用 ifelse:

    train$Income.Group<-ifelse(train$Income.Group=="1","<=50K",">50K")
    

    【讨论】:

    • 我之前在编码时使用了相同的代码,并且它只为income.group dataset 的所有行提供了一个值 1。我再次使用相同的代码,我的所有值都转换为 >50k 。请告诉我有没有其他出路。因为我在任何时候都使用它,它只为所有列分配一个值。在此先感谢,请评论
    • 我刚刚又读了一遍你的代码。首先,您使用 train$Income.Group
    猜你喜欢
    • 1970-01-01
    • 2021-07-13
    • 2013-04-10
    • 2020-07-09
    • 2017-05-14
    • 1970-01-01
    • 2011-12-13
    • 1970-01-01
    • 2011-07-28
    相关资源
    最近更新 更多