如何按列对摘要的输出进行排序？答案

【问题标题】：How to sort the output of summary by a column?如何按列对摘要的输出进行排序？
【发布时间】：2021-05-14 00:23:04
【问题描述】：

我想按 p 值对汇总输出进行排序我试过了

lm.fit <- lm(TARGET ~ .,train)
df<-summary(lm.fit)

colnames(df,c("Predictor","Estimate","StdError","tvalue","pvalue","signifcodes"))
rev(sort(lm.fit$pvalue)) -> cf

但我得到一个错误

if (do.NULL) NULL else if (nc > 0L) paste0(prefix, seq_len(nc)) else character(): "条件长度 > 1 并且只有将使用第一个元素” if (do.NULL) NULL else if (nc 0L) paste0(prefix, seq_len(nc)) else character(): 参数不能解释为逻辑回溯：

colnames(df, c("Predictor", "Estimate", "StdError", "tvalue", . "pvalue", "signifcodes"))

【问题讨论】：

标签： r

【解决方案1】：

从summary得到的df对象不是数据框或矩阵，colnames需要如下：

一个类似矩阵的 R 对象，至少有两个维度

您可以提取系数，然后确定顺序和排序。这是解决此问题的一种方法：

lm.fit <- lm(mpg ~ ., mtcars)

smry.lm <- summary(lm.fit)
coef.lm <- coef(smry.lm)

i <- order(coef.lm[,4], decreasing = TRUE)
coef.lm[i, ]

使用broom，您还可以执行以下操作：

library(broom)

coef.tidy <- tidy(lm.fit)
colnames(coef.tidy) <- c("Predictor", "Estimate", "StdError", "tvalue", "pvalue")
coef.tidy[order(coef.tidy$pvalue, decreasing = TRUE), ]

输出

   Predictor   Estimate StdError tvalue pvalue
   <chr>          <dbl>    <dbl>  <dbl>  <dbl>
 1 cyl          -0.111    1.05   -0.107 0.916 
 2 vs            0.318    2.10    0.151 0.881 
 3 carb         -0.199    0.829  -0.241 0.812 
 4 gear          0.655    1.49    0.439 0.665 
 5 drat          0.787    1.64    0.481 0.635 
 6 (Intercept)  12.3     18.7     0.657 0.518 
 7 disp          0.0133   0.0179  0.747 0.463 
 8 hp           -0.0215   0.0218 -0.987 0.335 
 9 qsec          0.821    0.731   1.12  0.274 
10 am            2.52     2.06    1.23  0.234 
11 wt           -3.72     1.89   -1.96  0.0633

【讨论】：