【问题标题】:Plot multiple box-plots (several numeric variables vs. one categorical variable) in R在 R 中绘制多个箱线图(几个数值变量与一个分类变量)
【发布时间】:2015-11-26 11:16:01
【问题描述】:

我的问题与此链接完全相同 Plot multiple box-plots using columns of dataframe in R

唯一的区别是我在数值变量中有很多 NA,我尝试运行 jbaums 建议的代码(您可以在此链接中看到建议的编程代码),但结果为 NULL。您对解决此问题有任何想法。谢谢。

例如:

categ<-c(1,2,2,1,2,2,1,2,1,2)
var1 <- c(10:15,NA,NA,NA,34)
var2 <- c(100:115,NA,23,NA,34)
var3 <- c(20:25,NA,NA,NA,34)
var4 <- c(1000:1015,23,NA,NA,500)
var5 <- c(1:5,NA,NA,NA,NA,NA)
data.frame(categ,var1,var2,var3,var4,var5)

【问题讨论】:

    标签: r


    【解决方案1】:

    您能否发布您正在运行的确切代码和数据示例?只需一个head(data) 甚至只是str(data) 就足够了。

    查看 boxplot 的文档(R 控制台中的?boxplot)表明默认行为是忽略 NA 值,但您可以尝试在对 boxplot 的调用中设置 na.action = NULL。如果它不起作用,则问题出在您的代码的其余部分。

    【讨论】:

    • 您好,感谢您的评论,我刚刚添加了一个简单的示例。我有一个非常大的数据集,其中列中有很多 NA。
    • 好的,使用上面的示例并按原样运行 jbaums 的脚本,它对我有用。但是,控制台输出确实说“null”,但我认为这是预期的行为?您是在 R Studio 还是在控制台中运行它?这些情节为我在一个单独的窗口中打开。请参阅添加到我的答案中的屏幕截图。
    • 嗨,由于此错误,我无法获取某些变量的箱线图:boxplot.default 中的错误(split(mf[[response]], mf[-response]), .. .) : 'names' 属性 [2] 必须与向量 [1] 的长度相同。您对解决此问题有任何想法吗?
    • 您的分类数据中有多少个因子?听起来您的名称参数长度错误,也许暂时不使用names=c("categ1","categ2")。名称的数量应该等于因子的数量。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-03-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-06-02
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多