【发布时间】:2019-05-18 19:55:04
【问题描述】:
我有一个关于比较超过 3 个有序变量中的因子的问题。
我已经在 Rstudio 和 Datacamp 上尝试过。在处理超过2个序数变量(低、中、高)时设置特定顺序后,在比较高和中时,为什么“高>中”会产生FALSE?
temperature_vector <- c("High", "Low", "High","Low", "Medium")
factor_temperature_vector <- factor(temperature_vector, order = TRUE, levels = c("Low", "Medium", "High"))
factor_temperature_vector
#The above line returns:
#[1] High Low High Low Medium
#Levels: Low < Medium < High
high <- temperature_vector[1]
medium <- temperature_vector[5]
low <- temperature_vector[2]
high > low #returns FALSE
high > medium #returns FALSE. Why?
已解决:
需要比较因素而不是变量:
high <- **factor_**temperature_vector[1]
medium <- **factor_**temperature_vector[5]
low <- **factor_**temperature_vector[2]
【问题讨论】:
-
您正在比较基于字母顺序排序的字符串
-
感谢您的回复。但是如果按照字母顺序,这两个语句都应该是 TRUE?
-
两者都应该是
FALSE"h" > "m"# [1] FALSE -
好的,谢谢。我现在明白了。如果我想比较它们,我需要比较因素,而不是变量。