【发布时间】:2015-08-13 12:37:16
【问题描述】:
我正在尝试解决 Data camp Introduction to R 中的一个问题。问题的陈述如下
作为一名数据分析师,您决定加入 Rways,这是一家只提供基于数据驱动决策的航班和服务的新航空公司。业务进展顺利,管理层正在考虑将报价从仅经济舱扩展到商务舱和头等舱。您应该处理调查问卷的结果,该问卷调查了受访者的首选类别。其中 50 个受访者的结果可以在字符向量 fly_class 中找到。
将 fly_class 向量转换为因子 fly_class_factor。因素 级别应该是“经济”、“商业”和“第一”。排序因子 如果这在这种情况下有意义。
苍蝇类向量包含
> > fly_class
[1] "eco" "bus" "eco" "bus" "fir" "eco" "eco" "bus" "eco" "eco" "fir" "eco"
[13] "eco" "eco" "eco" "bus" "eco" "eco" "eco" "fir" "bus" "eco" "eco" "fir"
[25] "eco" "bus" "eco" "eco" "eco" "eco" "fir" "fir" "eco" "bus" "eco" "eco"
[37] "bus" "eco" "eco" "eco" "eco" "eco" "eco" "eco" "eco" "eco" "eco" "eco"
[49] "eco" "bus"
当我尝试下面的 sn-p 时,R 引入了因子。我需要知道为什么要引入它。
> fly_class_factor <- factor(fly_class, ordered = TRUE, levels = c("economy", "business", "first"), labels = c("eco", "bus", "fir"))
> fly_class_factor
[1] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
[16] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
[31] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
[46] <NA> <NA> <NA> <NA> <NA>
Levels: eco < bus < fir
【问题讨论】:
-
您必须提供正确的关卡并稍后重命名关卡。也许有更好的解决方案,不确定
-
你只需要在你的 factor() 函数中交换级别和标签
-
已更改,但没有预期结果
-
你确定吗?比较您上面的代码、Gaurav 建议的更改以及下面我的答案。
-
不完全。
levels = c("eco", "bus", "fir")和labels = c("economy", "business", "first")。这是一个很难发现的区别。